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В современных психологических исследованиях необхо- 


димо использовать точные статистические методы описания * 


явлений и проверки гипотез. Однако учебная литература 
по основам теории вероятностей и математической стати- 
стики для студентов, специализирующихся по психологи- 
ческим дисциплинам, в настоящее время отсутствует. Дан- 
ная книга представляет собой попытку в определенной мере 


восполнить этот пробел. В ней систематизирован обширный. 


арсенал статистических методов описания и проверки гипо- 
тез, применяемых при изучении психических явлений на 
качественном и количественном уровнях. Изложение суще- 
ства методов и условий их использования иллюстрируется 
многочисленными конкретными примерами из общей, педаго- 
гической, медицинской, социальной и инженерной психо- 
логии. 

Книга предназначена для студентов младших курсов 
психологических факультетов, отделений и специализаций. 
Она также может быть полезной для старшекурсников, 
аспирантов и научных сотрудников. | 
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СВЕТЛОЙ ПАМЯТИ 
БОРИСА ГЕРАСИМОВИЧА АНАНЬЕВА 
ПОСВЯЩАЮ 


ПРЕДИСЛОВИЕ 


Математическая статистика — это наука о случайных явле- 
ниях. Нод явлением понимается любой подлежащий изучению 
объект независимо от его конкретного содержания. По степени 
количественной определенности явления рассматриваются как 
отдельные события, величины, функции и как системы событий, 
величин, функций. Если изучаемые объекты можно трактовать 
как следствия. многочисленных разнообразных по действию при-. 
чин, ТО интересующие исследователя. свойства этих объектов 
определяются неоднозначно и могут быть предсказаны лишь 
в результате массовых наблюдений не полностью, а с большей или 
меньшей вероятнестью. Такие объекты и характеризуются как 
случайные явления (случайные события, величины, функции 
или их системы). 

Математическая статистика занимается математическим опи- 
` санием случайных явлений, т. €. построением вероятностных мо- 
делей, а также проверкой их пригодности. Поэтому выделяют два 
раздела: описательную статистику и статистику «проверяющую» 
(статистическую проверку гипотез); соответственно разделяется 
и методический аппарат. Понятия и методы описательной стати- 
стики создаются в теории вероятностей, а понятия и методы стати- 


стической проверки гипотез создаются в специальных теориях 
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(например, в теории статистических решений), либо в приложе- 
ниях теории вероятностей к конкретным наукам. 


Современное развитие обширного: комплекса наук о человеке ¥ 
предполагает широкое использование методов математической 
статистики уже потому, что именно в этих науках объекты иссле- 
дования в наибольшей мере удовлетворяют понятию случайных 
явлений. Благодаря огромной структурной и функциональной 
сложности, психические, социальные, педагогические ит. п. 
_явления издавна служили развитию самой математической ста- 
тистики (здесь достаточно упомянуть Ф. Гальтона, развившего 
первоначальные идеи корреляции и регрессии, Ч. Спирмена, 
создавшего ранговую корреляцию и однофакторный анализ, Л. Tep- 
стона, разработавшего мультифакторный анализ). Однако к на- 
стоящему времени собственный понятийный и методический аппа- 
рат математической статистики значительно развился и услож- 
нился, что естественно вызывает трудности его использования 
в «не математизированных» еще науках. 

Примеры зарубежных руководств по предмету, собственный 
опыт автора и его коллег убедительно свидетельствуют о необ- 
ходимости специальной интерпретации основных идей, понятий 
и методов математической статистики для специалистов психо- 
логических и смежных с ними дисциплин. В этой связи, очевидно, 
изложение основ математической статистики не может и не должно 
быть отягощено необходимыми для математика, но излишними 
для психолога математическими подробностями. Учитывая ска- 
занное, автор ставил перед собой следующие задачи: 1) дать 
минимум языка (основные понятия и символы), необходимый 
и достаточный для подготовки экспериментального исследования, 
первичной и последующей специальной обработки полученных 
данных, для углубленного изучения специальной литературы; 


Е 2) ознакомить (в общем виде и на примерах из области психоло- 


гии, педагогики, социологии и т. д.) с системой идей и вероятно- 


* B. Г. Ананьев. Человек как предмет познания. Изд. ЛГУ, 1968. 


стных методов, которые целесообразно использовать в комплексе 
психологических дисциплин; 3) показать на конкретных примерах 
из разных областей психологии пути и способы применения тех 
методов теоретико-вероятностного описания и проверки статисти-. 
ческих гипотез, которые не требуют использования электрон- 
ных вычислительных машин. В этой связи книга имеет ряд OCO- 
бенностей. 


'В изложении автор основывался на системном подходе, есте- 
ственном для познания психических, социальных, педагогических 
ит. п. явлений, в котором существенное значение имеют уровни 
квантификации изучаемых объектов, а также последовательный 
переход от номенативной квантификации свойств (события) к их 
упорядочиванию и ранжированию, и затем к уравниванию ин- 
тервалов и отношений (величины, функции). Изложение прибли- 
жено к задачам психологической теории и практики и везде 
поясняется примерами, большинство из которых взято из конкрет- 
ных исследований автора или его коллег. Для работы над книгой 
читателю достаточно математической подготовки в объеме средней 
школы. Изложение ведется без доказательств, а вся необходимая 
терминология и символика из высшей математики вводится 
по мере надобности. Необходимые сведения о матрицах и дей- 
ствиях с ними даны в Приложении 1 (к нему следует обратиться 
при первой же встрече с понятием матрицы). Существенное BHH- 
мание уделено специальным понятиям и терминам из теории ве- 
роятности и других разделов математической статистики. Автор 
глубоко убежден, что робость перед математическими методами 
и трудности в их усвоении и использовании обусловлены «язы- 
ковыми» трудностями. Поэтому, подчеркивая термины, рекомен- 
дуемые к употреблению, автор стремился приводить. также сино- 
нимы, встречающиеся в специальной литературе. Библиография 
использованных математических источников приведена в конце 
книги, ссылки в тексте сделаны на работы нематематического 
характера. Автор старался представить широкий арсенал воз- 
можностей и методических средств математической статистики 
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B психологических и смежных дисциплинах, особое внимание обра- 
щая на методы, важные для этих наук, но мало освещенные в лите- 
ратуре, доступной широкому кругу исследователей. Тем не менее, 
отбор материала в книгу, видимо, не лишен определенного субъек- 
тивизма.. Shi 

Автор считает своим приятным долгом выразить признатель- 
ность профессору Б. Ф. Ломову, -который предложил ему разра- 
ботать и читать на факультете психологии курс лекций по мате- 
матической статистике, профессору B. Г. Ананьеву, который cno- 
собствовал развитию изысканий автора на этом пути и благодаря 
поддержке которого была создана эта книга, а также всем пре- 
подавателям и сотрудникам факультета психологии, помогавшим 


ему советами и материалами. 


Prasa t 


КОЛИЧЕСТВЕННЫЕ XAPAKTEPHCTHKM СЛУЧАЙНЫХ 
СОБЫТИЙ 


$ 1.1. СОБЫТИЕ И МЕРЫ ВОЗМОЖНОСТИ ЕГО ПОЯВЛЕНИЯ 


1.1.1. Определение события 


Событием называют всякий реальный или воображаемый факт, 
который интересует исследователя. О событии говорят, что оно 
появляется, наступает, происходит, имеет место и т. п. Наблю- 
дение или эксперимент, в котором могут появляться какие-либо 
события, называется`опытом. Существующие объективно или CNE- 
циально вызываемые события, известные экспериментатору и 
влияющие на ход опыта, называются условиями (опыта). Так как 
условия могут быть очень многочисленными, то обычно из их 
числа выделяют небольшую группу основных условий, влияние 
которых на ход опыта наиболее существенно. В отдельных слу- 
чаях в качестве основных принимаются условия, которые по ка- 
ким-то соображениям наиболее желательны для целей исследова- 
ния. События, которые объективно влияют на ход опыта, но о ко- 
торых экспериментатору ничего не известно, в число условий 
опыта не включаются. События, которые при данных условиях 
могут произойти в опыте, называются исходами (опыта). Условия 
опыта вместе с АЕ возможных исходов называются 
испытанием. 

Пример 1.1.1. Опыт состоит в наблюдении за учеником, реша- 
ющим задачи. Условиями опыта являются: возраст и уровень 
образования ученика, место и время наблюдения, характер задачи 
(по виду учебной дисциплины) и тип задачи (по виду решающего 
правила), время, отпущенное на решение и т. п. В зависимости 
от целей наблюдения за основные условия может быть принята 
любая часть или все перечисленные условия. Как правило, многие 
из событий, способных влиять на исходы опыта, не могут быть 
включены в круг условий. Например, наличие у ученика опре- 
деленных побуждений неучебного характера, безусловно, влияет 
на то, как он решает задачу. Но, будучи скрытыми от наблюда- 
теля, эти побуждения вне специального эксперимента ‘не могут 
учитываться в качестве условий опыта. 

При решении конкретной задачи учеником можно выделить 
два или три исхода. Два исхода: первый — ученик решает 
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задачу правильно, второй — ученик не решает задачу. Второй 
исход, в свою очередь, может быть подразделен на два новых 
исхода: ученик решает задачу неправильно, и ученик не доводит 
решение до конца и отказывается от дальнейших попыток, потому 
что не знает, что делать. Таким образом, в случае трех исходов 
выделяются: первый — ученик находит правильное решение 
и решает задачу до конца, второй — ученик неправильно решает 
задачу до конца и третий — ученик не решает задачу до конца. 
Попытки решить одну задачу при перечисленных условиях, при- 
водящие к одному из указанных исходов, образуют одно испыта- 
ние, попытки решить вторую задачу — второе испытание и т. д. 


~- 


1.1.2. Случайные n неслучайные события 


Случайным называется событие, которое при определенном 
комплексе условий опыта в каждом конкретном испытании может 
происходить, а может и не происходить. Так, в примере 1.1.14 
ученик может решить предложенную задачу правильно, а может 
и не ренить. Поэтому факт правильного решения задачи учеником 
можно рассматривать как случайное событие. Аналогично и про- 
тивоположный факт — неправильное решение задачи — тоже слу- 
чайное событие. Достоверным называется событие, которое всегда 
имеет место при определенном комплексе условий. Например, 
нормально развивающийся ребенок всегда начинает говорить. 
на языке тех людей, с которыми общается в период освоения уст- 
ной речи. Невозможным называется событие, которое никогда 
не происходит при определенном комплексе условий. Например, 

животное, лишенное человеческого мозга и артикуляторных Opra- 

нов, не может пользоваться человеческой речью. Достоверные 
и невозможные события объединяются понятием неслучайных 
событий. 

Как мы указывали в предисловии, большинство фактов пси- 
хической жизни человека и животных можно рассматривать как 
случайные события. Трудно назвать какое-либо- психическое явле- 
ние, которое бы наступало во всех случаях, когда имеются соот- 
ветствующие условия. Всегда есть исключения: рождаются дети 
с одной рукой или с двумя головами; наряду с нормальными, 
появляются дебилы, имбицилы и идиоты, с одной стороны, 
талантливые и гениальные — с другой; как бы внимательно ни сле- 
дил наблюдатель за интересующим его объектом, внимание может 
быть отвлечено каким-либо посторонним раздражителем. Примеры 
можно легко умножить, но здесь мы ограничимся сказанным. 

Важно отметить, что под категорию случайных теоретически 
подпадают все события, которые хотя бы однажды не появляются 
тогда, когда они должны были появиться, несмотря на то, что 
прежде они появлялись всегда. Но практически такие события 
принимают за достоверные. Аналогичное утверждение можно 
сделать и в отношении невозможных событий. Поэтому нет, 
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в сущности, четких границ между достоверными и случайными 
событиями, а также между случайными и невозможными собы- 
тиями. После того как мы рассмотрим понятие о вероятности, 
мы вернемся еще раз к разделению достоверных, случайных 
и невозможных событий. 


1.1.3. Частота, частость и вероятность 


Каждый знает по личному опыту, что одни случайные события 
происходят сравнительно часто, а другие — редко. Например, 
в Ленинграде часто идет дождь, а вот жара в 30° бывает редко. 


ТГриппом мы болеем часто, а психическими заболеваниями — 


0 200 400 . 5600 800 1000 1200 


Рис. 1.1.1. Рассеивание значений частости цифры «7», вычисленных по груп- 
пам из. пятидесяти исходов. 


По оси ординат — частости, по оси абсцисс — количеетво исходов; d характеризует 
величину рассеивания. 


сравнительно редко. Слова «часто», «редко», наряду с другими 
отображают в языке ожидаемую степень возможности появления 
случайных событий в окружающей нас действительности. Но воз- 
никает вопрос об объективной мере возможности появления слу- 
чайных событий. В качестве такой меры могут использоваться 
частота, частость и вероятность события. 

Частотой события называется количество случаев появления 
события. Пусть в примере 1.1.1 ученик правильно решил 8 задач. 
Это и есть частота правильного решения задачи учеником. Легко 
видеть, что частота зависит от количества испытаний. Тот же уче- 
ник из пяти задач мог решить, например, четыре задачи, а из 
двадцати — шестнадцать. Ясно, что при большем количестве на- 
блюдений одно и то же случайное событие будет встречаться 
«чаще». Частота может служить в качестве сравнительной оценки 
возможности появления случайных событий -лишь при условии 
одинакового числа испытаний. Если же это условие не выпол- 
няется, то нужна другая мера. Такой мерой возможности появле- 


ния случайных событий является частость. 
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Частость — это относительная частота, т. е. частота, деленная 
на количество испытаний. Обозначая частоту f, количество MC- 
пытаний N, а частость р, можем записать: 


а. | (1.1.4) 


Частость в гораздо меньшей степени зависит от количества 
испытаний, чем частота. Так, если ученик из пяти задач правильно 
решил 4, из десяти — 8, а из 
двадцати только шестнаднать, 
то частость во всех трех 
случаях будет одинакова: 4/5. 

Tem не менее и частость не 
является наилучшей мерой 
возможности появления слу- 
чайного события. Покажем 
это на примере. 

Пример 1.1.2. В ряде слу- 
чаев важно знать, какова 
возможность спонтанного во- 
спроизведения памятью чело- 
века хорошо известных ему 
образов. Например, как часто 
среди произвольно называе- 

х-х мых или записываемых OT- 


и ол 


0 50 00 200 400 600 650 дельных арабских цифр появ- 
р J 12 y ляется определенная цифра? 
“HC 1.1.4. меньшение величины рас- v 
сеивания значений частости цифры «7» Был организован несложный 


в зависимости от количества исходов, ЭКбПперимент, в котором испы- 
из числа которых высчитывалась ча- туемому предлагалось запи- 


стость. сывать на листе бумаги 


По оси ординат — величина рассеивания (d), а 2 
по оси абсцисс — количество исходов, послу- цифры OT «О» до «9» B лю 


живших основанием для расчета частостей. GOM порядке, кроме прямого 

и обратного, и таким путем 
заполнить цифрами стандартный лист писчей бумаги. Рассмотрим 
в данном прима: частость записи цифры «7» одним из испы- 
туемых. 

Всего испытуемый записал более 1300 цифр, относительно 
которых частость записи цифры «7» составляет 0,108. Вычислим 
значения этой частости для каждых пятидесяти цифр, записанных 
испытуемым: для первых пятидесяти, для вторых пятидесяти, для 
третьих пятидесяти и T. д. Результаты приведены на рис. Ei 
откуда видно, что значения частости изменяются случайным об- 
разом в пределах от 0,04 до 0,16. Пределы изменения частости 
обозначены на рис. 1.1.1 буквой 4 и характеризуют рассеивание 
значений частости, определяемых по группам из пятидесяти 
испытаний. Поступая аналогичным образом, мы определили ча- 
стости цифры «7» за каждые 10, за каждые 100, 200, 400, 600 
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0,4 гх 
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и 650 цифр, записанных испытуемым, и нашли величину 4. Ре- 
зультаты представлены на рис. 1.1.2. Можно видеть, что рассеи- 
вание значений частости цифры «7» не остается постоянным, а бы- 
стро уменьшается при увеличении количества исходов, на основе 
‘которого вычислялись частости. Таким образом, частость события 
тоже зависит от количества испытаний. Но чем больше испытаний 
проведено, тем больше мы можем быть уверены в том, что значение 
частости отображает объективную возможность появления инте- 
ресующего нас события, а не обусловлено количеством испытаний. 
Полностью, однако, избавиться от влияния числа испытаний, 
пользуясь частостью, нельзя. Необходима другая мера. Такой 


мерой объективной возможности появления события является 
вероятность. 


1.1.4. Статистическое определение вероятности 


Существует немало определений того, что такое вероятность. 
Здесь мы рассмотрим одно из наиболее распространенных. Оно 
предложено Р. Мизесом и обычно называется «статистическим» 
определением вероятности. Как видно из примера 1.1.2, при уве- 
личении количества испытаний значения частости изменяются 
все меньше и меньше, приближаясь к некоторому постоянному | 
значению. Обозначив это значение Р, можем записать: 


P=lim* L, (1.1.2) 
N= 
Постоянное значение, к которому как к своему пределу стремится 
частость при неограниченном увеличении количества испытаний, 
и называют вероятностью. | 
На практике, очевидно, невозможно увеличивать количество 
испытаний до бесконечности. Поэтому непосредственно из опыта 
определить значение вероятности событий нельзя. В отдельных 
случаях, при определенных условиях, можно априори определить 
значение вероятности. Это так называемое классическое определе- 
ние вероятности. Примерами такого определения являются ве- 
роятности выпадения «герба» или «решки» при бросании монеты 
правильной формы, равные */, каждая, или вероятности выпадения 
любой из сторон игральной кости (кубика), имеющей правильную 
форму, соответственно равные !/5 (по числу сторон). В большин- 
стве практических приложений все же приходится пользоваться 
частостями как.оценками для вероятностей, определяемыми в длин- 
ных сериях испытаний.** 
Как следует из уравнений (1.1.1) и (1.1.2), и частость, и ве- 
роятность численно могут принимать любое значение между ну- 
лем и единицей. Действительно, если f = п, то P = 1, и событие, 


* Знак «Ши» читается как «предел» или «лимит». 
** Вопрос о точности таких оценок рассматривается в главе 5. 
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о котором идет речь, является достоверным. Если же f = 0, то 
P = 0, и событие является невозможным. Теоретически частость 
и вероятность сколь угодно мало могут отличаться от нуля или 
единицы, но практически результаты округляются. Например, 
= 0,999 округляется до P =Т, а P = 0.001 — no P = 0. 
этому, как указывалось выше, «граница» между случайными и He- 
случайными событиями весьма условна. Очень частые случайные 
события на практике могут быть приняты за достоверные, а очень 
редкие — за невозможные события. Таким образом, вероятность 
как Mépa возможности появления события характеризует количе- 
ственно и случайные, и неслучайные события. Согласно термино- 
логии, рекомендованной к использованию в научной литературе 
Комитетом научно-технической терминологии, вероятность — это 
«положительное число, не превышающее единицу, представляющее 
собой количественную меру возможности появления случайного 
события в повторяющихся от опыта к опыту основных условиях. .. 
Она определяет среднюю частость, с которой можно ожидать 
появления случайного события в длинных сериях независимых 
‘испытаний». * 
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1.1:5. Геометрическое определение вероятности 


Каждому числу может быть однозначно сопоставлен отрезок 
прямой линии, часть плоскости или некоторый объем. Это изо- 
_ бражено на рис. 3. Отметим, что вместо квадратиков можно было 
бы взять любые другие фигуры, а вместо кубов — другие тела, 
лишь бы площади (или объемы) соотносились пропорционально 


числам. Пусть теперь имеется некоторая вероятность Р, выра- 


жаемая через среднюю частость d : 


Pa, 
x 
где f m n — какие-то числа, например, f = 1, n = 2. Тогда, co- 
гласно рис. 1.1.3, сопоставляя этим числам какие-либо геометри- 
ческие фигуры, мы можем выразить нашу вероятность как от- 
ношение двух площадей плоских фигур (Sı и S), либо как OT- 
ношение двух длин отрезков (Lı и Ls), либо как отношение двух 
объемов некоторых тел (ТУ, и V3), т.е. как отношение, имеющее 
заданную величину 1/2. Если отношение имеет другую величину, 
то мы соответствующим образом выбираем длины, площади, 
объемы. Итак, геометрически вероятность представляет собой 
отношение длин, площадей и объемов (в общем случае — гипер- 
объемов).** Геометрическая интерпретация вероятности позволяет, 


* Надежность технических систем и изданий. Основные понятия. Тер- 
минология, вып 67а. «Наука». М., 1965, стр. 22. 

У Т.Г. Абертауз АВ. Тронь, Ю.Н. Копенкин, И. А. Ко- 
ровина. Справочник по вероятностным расчетам. М., 1966, стр. 26. 
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во-первых, наглядно изображать вероятностные соотношения. 
между событиями (чем всегда пользуются), а во-вторых, облегчает 
решение некоторых практических задач. 

Пример 1.1.3. Одной из важных задач человека-оператора 
является контроль за показаниями приборов, предполагающий 
опознание цифр и условных знаков на лицевых частях приборов. 
Пусть произошло отклонение одного из контролируемых пара- 
метров, что выразилось в изменении показаний соответствующего | 
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Рис. 1.1.3. Сопоставление числам геометрических фигур: 
отрезков (а), плоскостей (6), объемов (в). 


прибора, расположенного на приборной панели перед оператором. 
Допустим, что человек в 100% случаев правильно опознает из- 
менение показаний прибора, если он смотрит на этот прибор. 
Тогда возникает вопрос, какова вероятность события А, состоя- 
щего в том, что человек-оператор посмотрит на прибор, располо- 
женный среди других на приборной панели? 

Эту вероятность можно определить геометрически как отноше- 
ние площади, занимаемой прибором, к общей площади панели. 
Однако приборы разных типов имеют разную площадь лицевой 
части. Кроме того, известно, что человек правильно опознает 
объекты, попадающие в определенную область поля зрения, пло- 
щадь которой больше. площади лицевой части обычного стре- 
лочного ‘прибора. Поэтому определим искомую вероятность 
как отношение площади области поля зрения, соответствующей 
100%-ному опознанию, к площади приборной панели. 

Экспериментально установлено, что область поля зрения 
человека, соответствующая 100%-ному опознанию объектов, 
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находящихся в этой области, простирается в любом направлении 
от центра фиксации глаз на 10 град *, т.е. эту область можно 
по форме считать плоским кругом с площадью Si = лА?, где 
л = 3,14 и R = 10 град. Следовательно, S, = 314 (прах. Далее 
экспериментально показано, что существуют оптимальные (с точки 
зрения контроля) размеры Opn- 
борной панели. Они представ- 
лены в угловых величинах на 
рис.1.1.4.** Обозначим площадь 
панели S, тогда по рис. 4 эта 
площадь — составляет: Da 
26g (18 pl = 16728 
(град.). *** Полагая, что зрение 
оператора одинаково часто. 
фиксирует любую часть пло- 
щади приборной панели, Bbl- 
числим интересующую HaC 
вероятность события А (состоя- 
щего в том, что человек-опера- 


Рис. 1.1.4. Оптимальные угловые 
размеры приборной панели (по Ma- 
хомову и Измаильцеву) в градусах. тор посмотрит на прибор, распо- 


Арабскими цифрами обозначены квад- ложенный на панели) как OT- 
анты. 
R ношение площади . области 


100%- -ного опознания к площади приборной панели: 


р A 
Р(А) = 5, = в тэв ~ 0019. 


$ 1.2. СИСТЕМА СЛУЧАЙНЫХ СОБЫТИЙ 
4.2.1. Понятие о системе событий 


Системой событий будем называть совокупность событий, рас- 
сматриваемых вместе. События в системе приобретают свойства, 
`которых они, если их рассматривать по отдельности, не имеют. 
Так, события в системе могут происходить совместно или не сов- 
местно. Они могут зависеть друг от друга. Одно событие может 


* Ю.Б. Гицпенрейтер. Опыт экспериментального исследования 
работы зрительной системы наблюдателя. В сб. Инженерная психология. 


Изд. МГУ, 1964, стр. 223. 
** А, Ф.П ахомов, А. М. Измаильцев. Экспериментальные 


исследования по рациональному размещению индикаторных устройств в поле 

зрения оператора. В сб.: Проблемы общей и индустриальной психологии. 

Изд. ЛГУ, 1963. Перевод линейных размеров, приведенных этими авторами, 
x a 


в угловые осуществлялся нами по формуле: 0 = 0,00033. d. 60’ THO а — 


линейные размеры сторон панели, мм; 4 — дистанция наблюдения, мм; 
& — угловые размеры, град. Результаты нами округлены (с. недостатком) 


до целых. 
*** Размеры площадей 5 | и S при определенной дистанции наблюдения 


можно вычислить по формуле: 51 = 5;. 0,00039 42, где d — дистанция na- 
блюдения; при этом наименование (град.)? опускается. 
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быть представлено в виде определенной группы других событий. 
События в системе могут быть по- разному упорядочены в неко- 
тором пространстве. Все эти свойства имеют важное значение 
для практики. 


1.2.2. Совместное появление событий 


Все события в некоторой системе событий можно разделить 
на две группы, в зависимости от того, могут они или не могут 
появляться вместе в одном испытании. Одну группу составляют 
события, которые никогда не могут появиться вместе в одном и том 
же испытании. Если появляется одно из них, то все другие уже 
исключены. Такие события называются несовместными (несов- 
местимыми). Другую группу образуют события, которые могут 
появиться вместе в одном и том же испытании, но могут и не MO- 
явиться вместе. Такие события будем называть совместными 
(совместимыми). 

Пример 1.2.1. Опыт состоит в проверке восприятия испыту- 
емым знаков, предъявляемых тахистоскопически. Условия опыта 
подразделяются на три группы: условия, характеризующие ис- 
пытуемого; условия, характеризующие аппаратуру и процедуру 
опыта; условия, характеризующие предъявляемые знаки. На- 
пример, условия, характеризующие знаки, — это количество зна- 
ков в алфавите, угловые размеры, вид и степень контраста кон-. 
тура знака с фоном, наличие характерных деталей, степень соот- 
ветствия абриса знака изображаемому объекту и т. д. 

В качестве основных условий в конкретном исследовании выби- 
раются любые комбинации возможных условий. Испытанием 
является предъявление одного знака и возможные ответы испы- 
туемого, которые образуют исходы опыта. В данном примере 
можно выделить следующие исходы: первый — испытуемый пра- 
вильно называет (или записывает) предъявляемый знак; второй — 
испытуемый неправильно называет его; третий — испытуемый 
по каким-либо причинам не дает ответа. При необходимости 
можно детализировать второй и третий исходы. В частности, ис- 
пытуемый может: а) неправильно принять предъявляемый знак 
за другой знак из того же алфавита, например, предъявляется 
цифра «7», а испытуемый называет цифру «1»; 6) неправильно 
принять предъявляемый знак за другой знак из иного алфавита, 
например, предъявлялась цифра «5», а испытуемый в ответ Ha- 
звал букву «Б». Возможна и дальнейшая детализация каждого 
из новых исходов второго исхода. г 

Неправильно называемые знаки обычно имеют сходство с предъ- 
являемыми. Если можно точно условиться о том, в чем это сходство 
состоит, то все неправильно называемые знаки можно‘ разделить 
на группы по степени сходства с предъявляемым знаком, напри- 
мер, на две — сходных и несходных. Таким образом, второй ис- 
ход детализируется по крайней мере на четыре новых исхода. 
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Перечисленные исходы изображены на рис. 1.2.1 в виде дерева 
(или графа) событий. При таком изображении основание ствола 
означает исходное состояние, т. e. предъявление знака. События 
и соединяющие их стрелки образуют. «ветви». Исходом являются 
все события, составляющие отдельную «ветвь», считая от вершины 
ветви до основания ствола. Как видно по рис. 1.2.1, в примере 
нами выделено шесть исходов. 


Предъявление знака | 


| | 4 
у У. у 
2. Знак назван | 3. Испытуемый 


неправильно 


1. Знак назван 
не дал ответа 


правильно 


| | 
aeee 
$ } 


5. Неправильно назван 
знак из того же алфавита 


УТ s 


> 


4. Неправильно назван 
знак из другого алфавита 


| 

у 
6. Неправиль- 
но названный 


_ знак из 
другого алфа- 


у 


7. Неправиль- 
но названный 
знак из 


другого алфа- 


8. Неправиль- 
но названный 
знак из того 
же алфавита 


| 

у 
9. Неправиль- 
но названный 


знак из того 
же алфавита 


вита имеет вита не имеет не имеет 
| м ств 
сходство сходства. a E AS $ сходства 
с предъ- с предъ- р а с предъ- 
являвшимся являвшимся ри являвшимся 
знаком знаком знаком 
II III IV 2i V 
Pac. 1.2 Дерево событий, рассмотренных в примере 1.2.1. Арабские 


цифры RnR события, римскими цифрами обозначены исходы опыта. 


Все исходы опыта в примере 1.2.1 — это события несовмест- 
ные. Действительно, если знак назван правильно (исход 1), то 
остальные исходы невозможны уже в данном испытании. А вот 
события, указанные на рис. 1.2.1 под номерами 2, 4, 6 — это 
совместные события. Потому что, если назван знак из другого 
алфавита, то он назван неправильно. При этом ничто не мешает 
неправильно названному знаку иметь большое сходство с предъ- 
являвшимся. Мало того, именно большое сходство со знаком из 
другого алфавита может явиться одной из причин неправильного 
называния предъявлявшегося знака. Точно также совместны по 
три события 2, 4, 7; события 2, 5, би 2, 5, Ji, 
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Система несовместных событий, представляющих собой исходы 
опыта, называется полной группой событий. Поскольку коли- 
чество исходов, выделяемых в опыте, зависит от обстоятельств, 
понятие полной группы событий условно. В общем случае число 
исходов может быть бесконечно велико, как мы покажем в следу- 
ющей главе. Только в немногих частных случаях имеется неболь- 
ппое количество заранее известных исходов, образующих полную 
группу событий. Например, при бросании монеты — два, при 
бросании игральной кости — шесть, при назывании первой при- 
шедшей на ум арабской цифры — десять, а при назывании рус- 
ской буквы — тридцать три. Несмотря на условность понятие 
полной группы событий очень важно для правильного вычисления 
вероятностей. Поэтому рекомендуется по возможности заранее Ie- 
речислить все несовместные события, образующие полную группу. 


1.2.3. Зависимость между событиями. 


Появление одних событий в системе может`оказывать влияние 
на возможность появления других событий в той же или в другой 
системе. События называются зависимыми, если появление одного 
из них влияет на возможность появления другого. Если появле- 
ние одного события не влияет на возможность появления другого 
события, то эти события называются независимыми. Зависимость 
между событиями в системах может быть обоюдная или односто- 
ронняя, парная или множественная. Чаще всего в теории вероят- 
ностей рассматривается обоюдная зависимость между событиями, 
при этом считается, что если событие А зависит от события В, 
то и событие В зависит от А. В этом смысле, например, несовмест- 
ные события — всегда зависимые события, так как, по определе- 
нию, появление одного из них делает невозможным появление 
всех других. Но существует и односторонняя зависимость, напри- 
мер, между «видовыми» и «родовыми» событиями: если идет 
дождь (событие В), то на небе обязательно есть облака (событие 
А) — событие В зависит от события А; но не наоборот, так как, 
если на небе облака, то дождь может и не идти. Облака и дождь — 
события совместные и зависимые. Но совместные события могут 
быть как зависимыми, так и независимыми. Например, движения 
двух автомашин по улицам города — чаще всего события незави- 
симые,. но машины могут столкнуться на перекрестке, а одновре- 
менное появление двух машин в оном месте перекрестка — собы- 
тия совместные. | 

Зависимость. ‘между совместными событиями может быть не 
непосредственной, а опосредствованной некоторым явлением, вы- 
‚ ступающим в качестве их общей причины. Анализ таких причин, 
как и вообще содержательный анализ явлений, находится вне 
компетенции статистики. Статистика формализует причинно-след- 
ственные отношения между природными явлениями, лишь кон- 
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статируя факты влияния одних событий на возможность появле- 
ния других, а содержательная интерпретация этих фактов — 
задача специальных научных дисциплин. 


s 


1.2.4. Проетые и сложные события. Представление сложного 
события в виде комбинации простых событий 


В примерах 1.1.1 и 1.2.1 мы видели, что одно событие может 
быть детализировано на MBa M более событий. События, которые 
могут быть представлены в виде комбинации других событий, 
называются сложными событиями. Те события, из комбинации 
которых образовано сложное событие, называются простыми 
(элементарными) событиями. Сразу же отметим, что это общепри- 
нятое разделение весьма условно. Чаще всего «простое» событие 
можно детализировать на более «простые». Эти, в свою очередь, 
на еще более «простые» ит. д. Где остановиться в этом «дроблении» 
событий, зависит от цели исследования, от желаемой полноты 
описания изучаемых явлений, от количества испытаний, в кото- 
рых можно наблюдать выделенные события, и от многих других 
обстоятельств. 

В большинстве практических ` приложений сложные объекты 
всегда нужно стремиться представить через простые события, 
связанные определенными соотношениями. Сложные явления, 
с которыми имеет дело психолог, не всегда легко представить 
в виде системы, событий. Для этого необходимы определенные 
навыки, которые можно приобрести только на практике. А на 
первых порах требуются пробы и возможны ошибки. Все же при- 
обрести эти навыки необходимо, чтобы правильно определять 
‘исходы опыта, выбирая желаемую меру подробности описания 
изучаемых фактов и по возможности уменьшить объем последу- 
ющих вычислений, а часто и объем экспериментов. 

Существуют установленные правила сочетания простых собы- 
тий в сложные и наоборот, а также правила преобразования одних 
событий в другие. Этими правилами пользуются во многих Hayy- 
ных дисциплинах, в том числе — в теории вероятностей и в мате- 
матической статистике. Некоторые основные правила сочетания 
простых событий в сложные события вместе с принятыми словес- 
ными, наглядными и аналитическими формулировками предста- 
влены в табл. 1.2.1.* Отрицанием события А нгзывается несов- 


местное с ним событие А, образующее вместе с событием А полную 


группу. Событие А и его отрицание А называются противополож- 
ными событиями. Обычно отрицанием события А называют тот 
факт, что событие А в опыте не появляется. При этом отрицанию 


* В книгах по математической и прикладной статистике наряду с терми- 
нами, обычно применяемыми в теории вероятностей, часто используется 
специальная терминология теории множеств и математической логики. 
Поэтому мы сочли полезным ее привести. 
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Основные прабила сочетания простых событий в сложные Таблица 1.2.1 
| №] Те MUHD, : Слобесная h - $ Графическая Специальные формулиродки : Эквивалентная 
применяёмые : фоомулировка : интерпретация: : : 
9 теории |: формулир : (ĝu OOIMMH : 8 meopuu e eR :  JANUCD 
бероятностеи: : Benna ) : множест : 2 
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может быть подвергнуто как простое, так и сложное событие. 
Произведением событий называется сложное событие, которое 
состоит из совместных событий, появляющихся вместе. Под но- 
мером 2 в табл. 1.2.1 записано произведение двух событий. Ана- 
логично обозначается произведение трех событий (АВС — «и А, 
и В, и C»), четырех событий (ABCH — «и А, и В, n C, и Д») ит. д. 
Так, в примере 1.2.1 исходы II—V (см. рис. 1.2.1) представляют 
собой произведения из трех событий каждый. 

`Эключение событий характеризует отношение «видового» собы- 
тия к «родовому». Например, если испытуемый правильно назвал 
предъявленный ему знак, то из этого однозначно * следует, что 
он его воспринял. Но не наоборот. Гождество событий характе- 
ризует одинаковость объема понятий, изображаемых в виде собы- 
тий. Если при осуществлении комплекса- основных условий, при 
котором происходит событие А, наступает и событие В, то «А 


„А, Но не В” | 
(В запрещает . 
А”) 


* Теоретически рассуждая, следует думать, что испытуемый может 
чисто случайно правильно угадать предъявленный знак, ничего не воспри- 
нимая. Но опыт показывает, что вероятность такого угадывания пренебре- 
HAMO мала. 
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влечет за собой В». Если при этом имеет место и обратное, т. e. 
«В вто же время влечет за собой А», то события А и В называют 
равносильными и заменяют одно другим, следовательно, считают 
тождественными (эквивалентными). 

Тождество событий, так же, как и остальные события, указан- 
ные в табл. 1.2.1, позже мы поясним примером. Суммой (несов- 
местных) событий называется сложное событие, которое состоит 
в появлении только одного из несовместных событий. Суммой 
(совместных) событий называется сложное событие, которое со- 
стоит в появлении хотя бы одного из возможных совместных собы- 
тий, при этом в случае несовместного появления таких событий 
сумма не включает произведения слагаемых. В случае совмест- 
ного появления событий в сумму включается их произведение 
(табл. 1.2.1). Разностью событий называется сложное событие, 
которое состоит в появлении одного из совместных событий и не- 
появлении другого. | 

Сложные события можно по-разному выразить через простые 
события, пользуясь отрицаниями, произведениями и суммами. 

Помимо указанных, преобразований используются и другие, 
в частности, основанные на следующих тождествах: 


А=А = (1.2.1) 
— двойное отрицание события тождественно ему самому 
А--В=А.. В (4.2.25 


— отрицание суммы событий тождественно произведению отри- 
цаний слагаемых. Это тождество обобщается на любое число собы- 
тий. Чтобы избежать ошибок, запомним, что отрицание суммы 


не тождественно сумме отрицаний слагаемых: А + В == А-В. 
На основе тождеств (1.2.1) и (1.2.2) запишем тождество, противо- 
положное тождеству (1.2.2): 


А+В=А.В Ее. 


— сумма событий тождественна отрицанию произведения из OT- 
рицаний слагаемых 

АВ=А-- В | (1.2.4) 
— отрицание произведения тождественно сумме отрицаний со- 
множителей, но: ` 


| AB Æ AB 
Отрицание тождества (1.2.4) приводит к следующему TOX- 
деству: 
ABSA tB: (1.2.5). 
Тождества (1.2.3) — (1.2.5) обобщаются ва любое число простых 
событий. 
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Все приведенные тождества легко можно доказать графиче- 
ски, пользуясь диаграммами Венна, приведенными в табл. 1.2.1. 
Эту возможность мы предоставляем читателю. 
| Пример 1.2.2. Опыт заключается в изучении принадлежности 
индивида к микрогруппе. Рассматриваются три микрогруппы. 
Пусть принадлежность индивида к одной из микрогрупи — про- 
стое событие. Соответственно принадлежность к первой из микро- 
групп обозначим как событие А, принадлежность ко второй из 
микрогрупп — как событие В, принадлежность к третьей — как 
событие С. Тогда возможны следующие сложные события. 

Событие 1. Индивид принадлежит только к первой микрогруппе 
и не принадлежит ко второй и третьей. Событие записывается 
в виде разности или произведения простых garak: 


А-В = @=АВС. 


Используя тождество (1.2.2), можно представить событие 1 в дру- 
гом виде. Для этого выполним преобразование: 


АВС-==А (ВС) =A (B F0). 


Читается событие 1 в этом случае так: «Индивид принадлежит 
к первой микрогруппе и не принадлежит ко второй или третьей». 
На основании тождества (1.2.2) мы заменили произведение отри- 
цаний событий В и С отрицанием их суммы. z 

События 2 u 8 аналогичны событию 1, но относятся ко второй 
и к третьей микрогруппам соответственно. Написать формулы 
этих сложных событий и преобразовать их предоставляется чи- 
тателю. 

Событие 4. Индивид принадлежит только к одной (любой, 
но одной!) микрогруппе. Это сложное событие записывается в виде 
суммы произведений несовместных событий: 


АВб--АВС+-АВС 


Применяя к этому выражению почленно тождество (1.2.2), можем 
преобразовать его так: 


А (B +0) -В(А+О-С(А-В). 


Событие 5. Индивид принадлежит к двум (любым) микрогруп- 
пам из трех. Событие записывается в виде следующей суммы 
произведений: X i 


АВС + АВС-- АВС. 


Здесь каждое из слагаемых обозначает принадлежность инди- 
вида к соответствующим двум микрогруппам, значит, событие 5 
состоит из трех других сложных событий. 
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Событие 6. Индивид принадлежит ко всем трем микрогрунпам; 
это событие записывается как АВС, либо на основе тождества 
(2.5 


A+B+C. 
Событие 7. Индивид не принадлежит ни Kk одной из трех микро- 
групн. Это событие записывается как произведение отрицаний 


простых событий: АВС, или на основе тождества (1.2.2): 


A+B+C. 


Заметим, что событие 7 не является противоположным событию | 
6. Отрицанием события 6 является следующее событие. 
Событие 8. Индивид не принадлежит ко всем трем микро- 


группам. Это событие записывается как АВС, либо на основе тож- 
дества (1.2.4), как. 


ЕВС 


Возможны и более сложные события. Отметим в дополнение 
к сказанному, что количество сложных событий, которые могут 
_ рассматриваться как исходы» опыта, быстро растет по мере уве- 
личения числа простых событий, так как допустимы любые их 
комбинации. | 

Рассмотрим в нашем примере еще четыре сложных события. 

Событие 9. Индивид не принадлежит ни к одной из микро- 
групп или принадлежит к одной из них, или принадлежит к двум, 
или ко всем трем. Это событие представляет из себя сумму собы- 
ий. 475, 6: 


АВС + (ABC + ABC + АВС) + (АВС + ABC + АВС) + АВС 
Событие 10. Индивид не принадлежит ни к одной из микро- 
групп или принадлежит к одной, или к двум микрогруппам, но 


‚не принадлежит ко всем трем. Это событие представляет из себя 
сумму событий 7, 4,5 n8: 


ABC + (АВС-+ АВС-- АВС) -+ (АВС+-АВС-- АВС) -- АВС. 


Событие 11.. Индивид принадлежит обязательно хотя бы к од- 
ной из трех групп. Это событие эквивалентно событию 9, у кото- 
рого отрицается событие 7: 


АВС + (ABC + ABC + АВС) + (ABC + ABC + АВС) + АВС. 
Событие 12. Индивид принадлежит только к двум из трех мик- 
уогрупп. Это событие эквивалентно событию ð, а также событию 


9, в котором все слагаемые, кроме события 5, заменены противо- 
положными событиями: 


АВС + (АВС-+ ABC + АВС) + (АВС-- ABC + АВС) + АВС 


Заканчивая пример, особо отметим, что на практике могут 
использоваться любые преобразования сложных событий. Это’ 
позволяет, смотря по обстоятельствам, облегчить сбор статисти- 
ческих данных и упростить вычисления вероятностей сложных 
событий. 


1.2.5 Уровни количественного определения событий * 


Под количественным определением (квантификацией) события 
_ будем понимать его замену числами. Целью такой замены является 
возможность оперировать числами вместо того, чтобы действовать 
с реальными вещами. Но операции с числами должны адекватно 
отображать действия с вещами и обосновываться известными нам о 
свойствами самих вещей, иначе получатся фиктивные результаты. 

Упрощенно подходя к задаче количественного определения 
некоторого реального явления, выделяют два традиционных 
уровня: уровень «словесного» качественного описания (события), 
уровень измерения (величины и чункции). Но величины и функ- 
ции тоже могут быть представлены как события. Поэтому здесь 
мы дадим несколько иную интерпретацию уровней количествен- 
ного определения применительно к событиям. 

Первый уровень количественного определения события — это 
его словесное описание, в котором указаны общие и специфиче- 
ские свойства, характеризующие данное событие, но ничего не го- 
ворится (потому что обычно ничего не известно) о степени выра-‘ 
женности этих свойств. События, определенные на таком уровне, 
будем называть классифицированными событиями. Типичный при- 
мер классифицированных событий — классический перечень тем- 
пераментов: сангвинический, холерический, флегматический и Me- 
ланхолический. Или перечень свойств нервной системы. Или 
алфавитный перечень букв и цифр, и т. д. Большинство психи- 
ческих явлений находится сейчас в психологии на этом уровне 
определения. Может показаться странным, что мы называем 
этот уровень уровнем количественного определения. Но это вполне 
правомерно. Мы можем перенумеровать классифицированные 
события числами и затем пользоваться этими числами как «име- 
нами» событий, что короче, чем длинные словесные описания. 
Правда, никаких привычных (в смысле обычной алгебры) операций 
с этими числами производить нельзя. Мы, далее, можем охарак- 
теризовать классифицированные события вероятностными Me- 
рами и упорядочить их в соответствии с вероятностями появле- 
ния. Мы можем, наконец, определять степень зависимости между 
классифицированными событиями. 


` 


+ * Вопрос о количественном определении событий — специальный вопрос, 
‚выходящий за пределы нашей темы. Однако возможность применения кон- 
- кретных статистических мер и методов зависит от уровня количественного 
определения изучаемых объектов. Поэтому мы коснемся этого вопроса. 
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Следующий, более высокий уровень количественного опре- 
деления, — это словесное описание события, в котором, кроме 
выделения общих и особых свойств, ‘характеризующих событие, 
указана степень проявления этих свойств, но не указана (обычно 
не известна) мера проявления. Так, например, сравнивая визу- 
ально длины двух отрезков, мы можем указать, равны ли они, 
- или одна больше или меньше другой. Но без привлечения обще- 
принятых известных нам мер длины (метров, сантиметров ит. п.), 
мы не можем сказать, насколько больше, или насколько меньше. 
Несколько отрезков мы можем упорядочить по возрастанию 
длины: «больше», «еще больше», «гораздо больше» и т. д.; или 
по убыванию длины: «меньше», «еще меньше», «гораздо меньше». 
Степень выраженности других свойств без указания меры пере- 
дается словами: «лучше — хуже», «дальше — ближе» и тому 
подобными прилагательными в сравнительной степени. События, 
количественно определенные на данном уровне, будем называть 
упорядоченными событиями. Поскольку упорядочение касается 
одного свойства, система упорядоченных событий образует ряд 
событий. В этом ряду события могут быть перенумерованы 
числами, величины которых должны отображать отношения 
«больше — меньше», т.е. ряду событий, упорядоченных по воз- 
растанию, должны сопоставляться числа, также упорядоченные по 
возрастанию, или наоборот. Эти числа можно суммировать и 
умножать, но, строго говоря, нельзя вычитать и делить. * 

Последний из выделяемых нами уровней количественного 
определения событий — уровень измерения. ** На этом уровне 
к словесному описанию предыдущего уровня добавляется указа- 
ние, насколько больше или насколько меньше выражено конкрет- 
ное свойство событий. Это указание может быть дано лишь 
посредством некоторой меры, что предполагает установление еди- 
ницы измерения данного свойства. События, количественно опре- 
деленные на данном уровне, будем называть измеренными собы- 
тиями. Этим событиям сопоставляются числа, определяемые в мет- 
рических системах измерения, т. е. системе событий сопоставляется 
система чисел, poty oann в результате измерения. Такая система 


* Дело в том, что операции вычитания и деления лежат в основе опре- 
деления метрических мер, а, согласно определению, на уровне упорядочен- 
ных событий меры не используются. 

** Термин «измерение» употребляется в широком и в узком смысле. 
В широком смысле под измерением понимается приписывание чисел вещам 
в соответствии с установленными правилами (С. С. Стивенс. Математика, 
измерения и психофизика. В кн. «Экспериментальная психология, т. 1, «Мир», 
М., 1963). В таком смысле классифицирование и упорядочивание событий — 
разновидности измерения. В узком смысле измерение понимается в метроло- 
гии. здесь под измерением понимают отношение измеряемой величины к ве- 
личине того же рода, принятой за единицу измерения. Результатом измере- 
ния является число, показывающее, во сколько раз измеряемая величина 
больше (меньше) единицы измерения (С. Ф. Маликов и Н.И. Тюрин. 
Введение в метрологию. Стандартгиз, М., 1965). Мы пользуемся здесь и ниже 
понятием измерения в узком смысле. — 
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чисел обычно называется величиной. Рассуждая в обратном по- 
рядке, получаем возможность рассматривать величину как систему 
событий, каждое из которых — это число. Для ‘измеренных собы- 
тий все операции с числами эквивалентны действиям с самими 
вещами, которые отображены в событиях. 

Все рассмотренное в предыдущих пунктах нашего изложения 
одинаково применимо к событиям, количественно определенным 
на любом из указанных уровней. Дальнейшее: изложение поведем 
с учетом различий в этих уровнях. 


$ 1.3. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СИСТЕМЫ 
КЛАССИФИЦИРОВАННЫХ СОБЫТИЙ 


Как указывалось, для классифицированных событий можно. 
определить меру возможности их появления, можно их сравни- 
вать и упорядочивать, согласно этой мере, и на ее основе опреде- 
лять наличие, степень и направление зависимости между собы- 
тиями, а также динамику событий. 


1.3.1. Вероятноети сложных событий 


Вероятность суммы несовместных событий равна сумме ве- 
роятностей слагаемых. 


РАНА, р... РА) =Р(А) ЕР). РА). 938 
Используя знак суммирования и обозначая порядковый номер 
события i= 1, 2, 3, ..., п, можем переписать (1.3.1) так: 
Р( У А; ) =J P (A). (1.3.2) 
i i 


Вероятность полной группы событий равна единице. Так как 
полная группа событий представляет собой сумму несовместных 
событий, то на основании (1.3.2) для всех событий А; (где i = 
= 1, 2, 3, ..., А), образующих полную группу, можно записать: 


k | 
> P (А). | (1.3.3) 
t=1 
‘Следует хорошо запомнить это очень важное в теории вероятно- 
стей и статистике положение. Противоположные события обра- 
зуют полную группу. Поэтому вероятность суммы противонполож- 
ных событий, согласно (1. 3.3), равна единице: P (А) + P (А) = 1, 
откуда: 

Р(А)=1-—Р(А) a Р(А) =1-Р(А), ‚- 3.4) 


т. е. вероятность события может быть выражена через вероятность 
противоположного события на основе (1.3.4). 

Вероятность зависимого события изменяется, если произошло 
другое из зависимых событий. Если события независимы, то 
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появление одного из них не изменяет вероятности другого. Пусть 
‘имеются зависимые события Å, Ås, ..., А‚. Вероятность зави- 
симого события А. при условии, что произошло другое из зависимых 
событий А!, называется условной вероятностью и обозначается 
P (A/A). Условная вероятность события А. при условии, что 
произошли события А, и А,, обозначается P (А./А.А.). Ana- 
логично ‘обозначаются любые другие условные вероятности: 
ААА. А... А), РАДА. Аз илтед. 

‚Вероятности независимых событий в отличие от условных Be- 
роятностей могут быть названы безусловными. Их мы и расссмат- 
ривали до сих пор, обозначая P (Ai), P (A), ..., Р(А,). 

Используя понятия условных и безусловных вероятностей, 
можно сформулировать условия статистической зависимости 
и независимости событий. Условия зависимости событий А и В 
выражаются в том, что условные вероятности этих событий не 
равны их безусловным вероятностям: 


P(A/B)ÆP (A) и Р(В/А) --Р(В). (1.3.5) 


Условия независимости событий А и В состоят в том, что условные 
вероятности этих событий равны их безусловным вероятностям: 


Р(А/В) =Р(А) и Р(В/А)=Р(В). (1.3.6) 


Если количество событий в системе больше двух и для каждой 
пары событий выполняются условия (1.3.5) или (1.3.6), то говорят 
о попарно зависимых (или независимых) событиях. Следует хоро- 
шенько запомнить условия (1.3.5) и (1.3.6), так как они лежат 
в основе проверки статистических гипотез о наличии или отсут- 
ствии связей между изучаемыми явлениями. 

Если количество событий в системе несовместных событий 
меняется (увеличивается или уменьшается), то изменяются и ве- 
роятности этих событий. Но эти изменения вероятностей обусло- 
влены только изменением количества событий в системе. В этой 
связи рассмотрим на примере понятие о зависимых и независимых 
испытаниях. 

Пример 1.3.1. У кабинета дежурного психотерапевта ожидают 
приема трое больных. Врачу известно по медицинским карточкам, 
что один из ожидающих, по фамилии Петров, болел в прошлом 
маниакально-депрессивным психозом. Врач интересуется этим 
больным, но не хочет вне очереди вызывать его в кабинет. Обо- 
значим как событие А тот факт, что в кабинет врача входит боль-. 
ной Петров; как событие В обозначим то, что входит другой боль- 
ной — ‘Сидоров (В!) или Иванов (В,). События А, В u B, — 
несовместные и образуют полную группу (предполагается, что к вра- 
чу больные входят по одному). Так как появиться, согласно оче- 
реди, может равновероятно любой из больных, а сумма вероятно- 
стей для полной группы равна 1, то до начала приема вероятность 
появиться первым в кабинете врача для одного из больных, в том 
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числе для Петрова, равна 1/4. Но вот первым входит Сидоров, 
T. e. произошло событие Bı. В результате вероятности событий 
Аи B, изменились. Снова события А и В, (теперь уже только два 
события) образуют полную группу. Опять появление в кабинете 
врача ‘любого из оставшихся больных равновероятно. Поэтому 
на основании (1.3.4) вероятности событий А и B, теперь уже равны 
1/5. Пусть вторым в кабинет врача вошел больной Иванов — про- 
изошло событие В.. В результате вероятность события А стала 
равна единице; TA А становится достоверным: третьим вой- 
дет только Петров (при условии, что он не уйдет, не дождавшись 
своей очереди). Таким образом, уменьшение количества ожида- 
ющих приема больных приводит к увеличению условной вероят- 
ности появления больного, интересующего врача. 

Пусть теперь ситуация изменится следующим образом. После 
того, как в кабинет врача вошел больной Сидоров, в приемную 
пришел четвертый больной, еще раньше занявший очередь и не- 
‘надолго уходивший. Таким образом, снова может войти один 
из трех больных и вероятность появиться Петрову не измени- 
лась (1/.). При независимых испытаниях определение вероятно- 
стей исходов значительно проще, чем при зависимых испыта- 
ниях. Поскольку экспериментатор обычно может организовать 
опыты по схеме независимых испытаний, к этому всегда следует 
стремиться. я 

Вероятность произведения двух зависимых событий равна 
произведению безусловной вероятности одного из них на условную 
вероятность другого: 


Р(АВ)=Р(А).Р(В/А)=Р(В)-Р(А/В). (1.3.7) 


Для трех зависимых событий к (1.3.7) добавляется еще один Co- 
множитель — условная вероятность простого события, вычислен- 
ная при условии, что первое и второе события произошли: 


P (ABC) =P (A) - P (B/A) - P (C/AB) =P (B) - P (A/B) - P (С/ВА) = 
= P (C) - P (A/C) - P (B/CA). 


Аналогично получается общая формула для вероятности произ- 
ведения произвольного числа зависимых событий: 


f: (í А, = P (A): P (A/A) - P (A3/A,A3) и Р(А„/А.А,А; 
Ар) *. (1.3.8) 


Пусть в примере 1.3.1 событие С состоит в том, что в кабинет врача 
первым и вторым входят не Петров, а другие больные — Сидоров 
(Bı) и Иванов (В.). Событие С — это произведение событий В,.В.. 


* Знак di обозначает произведение 1 всех сомножителей с порядковыми 
i=i 
номерами от įi = 1, до i=n. 
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Так как эти события зависимые, то P (C) = P (B)-P (В5/В,), 
т P (B/B) =1: 2; поэтому Е 
Е ЕВ 6. > 

Вероятность произведения независимых событий равна про- 
изведению вероятностей сомножителей. На основе условий. 
независимости (1.3.6) можем заменить в (1.3.8) все условные 
вероятности безусловными: 


р (п А, -T PAJE — (1.3.9) 
i=1 ; i=1 


Пример 1.3.2. Пусть испытуемому предлагается отрезок пря-_ 
мой, ориентированный вертикально. Испытуемый должен, мы- 
_ сленно продолжая отрезок снизу вверх, указать точку, удаленную 
вверх на заданную дистанцию, в которой, по его мнению, будет 
находиться продолжение отрезка. Эксперименты показали, что, 
действуя правой рукой, испытуемые в большинстве случаев OT- 
клоняются от вертикали влево. Был организован специальный 
эксперимент, целью которого было установить, в каком направле- 
‚нии происходит отклонение точки, указанной испытуемым, если 
он действует либо правой, либо левой рукой. Результаты обследо- 
вания 100 испытуемых представлены в табл. 1.3.1. Обозначив 
события, как показано в таблице, можно видеть, что имели место 
следующие четыре простых события: А, или А‚, В, или B, и че- 
тыре сложных события (произведения простых): А.В, или А.В», 
или Å Bı, или А.В.. Простые события будем считать условиями 
опыта, а сложные — его исходами. Всего проведено 205 испыта- 
ний. Частоты совместного появления событий А, иА, с событиями 
B, и В, указаны в числителях правых третей соответствующих 
клеток табл. 1.3.1. Это F(A B) = 12, 1 (А.В) = 91, А.В = 
= 54 и f (A,B) = 18. Частота безусловного появления события 
А, определяется суммой частот совместного появления этого 
события с событиями В. иВ.: | 


f (A1) = f (4B) + f (A,B) = 103. 


Аналогично суммированием по вертикали частот f(A,B,) и 
TA i e частота безусловного появления события 
: f (A) = 102. Суммированием по строкам определяются ча- 
тот Е. В, иВ.: f (В!) = 96 u f (Ba) = 109. Общее количе- 
ство испытаний (п) должно быть равно сумме f (AB) + 7 (ABa) + 
+ f (A-B) + f (A-B) и сумме f (A, + f (A2), и сумме f (B) + 
+ f (Ba). Выполнение этого тройного равенства — обязательное _ 
условие правильности табулирования результатов опыта и после- 
дующих вычислений. Поделив каждую из указанных частот на MN, 
определяем соответствующие оценки вероятностей (частости). 
Они и указаны в табл. 1.3.1. 
Определим теперь условные частости для событий АТ, AS 
В, a B, при всех условиях, когда происходили совместные с ними 
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ииночкопохАО ‘а ‘те 


$6 


Отклонение от вертикали 
Вправо (событие Bz) |Влеэдо (событие В1) 


К примеру 132 


Левой рукой ( событие А. 


Указы ба ние 


Правой рукой (событие Áo) - 


8 
Р(А›/ Ви) = а 


p(B /42)= 


= 18 
102 


Таблица #34 


p(B) 


} 


Таблица 1.3.2 


_ События независимые, если бсе они р равновероятны 


События независимые, если рабнобероятна хотя бы 
одна пара противоположных событии 


Таблица 133 


события. Событие В, наблюдалось всего 96 раз, из них 12 раз — 
при условии события В, — происходило событие А | и 84 раза — 
событие AÅ.. Соответствующие условные частости p (A/B) = 
= 12 : 96 u p (А/В!) = 84 : 96. Аналогично, событие B, наблюда- 
лось всего 109 раз. Из них 91 раз происходило событие 
А,: р(А!/В,) = 91: 109 и 158 раз происходило событие 
А,: p (A/B) = 18: 109. Эти условные частости записываются, 
как показано в табл. 1.3.1. 

Событие А, наблюдалось всего 103 раза. Из них 12 раз произо- 
шло событие В, : p (B/A) = 12: 103 и91 раз — событие B, 
р (B/A) = 91: 103. Аналогично определяются: р (B/A) = 
— 64102 р (В.А —48 : 102. 
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Эти четыре условные частости записывают в рабочую таблицу 
так, как это сделано в табл. 1.3.1. 

Сравнивая значения условных частостей, можно видеть, что 
они существенно отличаются от безусловных частостей. Это сви- 
детельствует о том, что события АА n B; A} n B, A,n B; nA, 
и В, — попарно зависимые От. ОР В с прабедтиворни 
фо му лы (1.3.7) для вероятности произведениях двух событий. 
Например, Pp (AB) = р (Ai): p (B1/A1) = Р (B1): P (А„/В,) а 
= 103 : 205.12: 103 = 96 : 205-12 : 96 = 12 : 205. Из той же фор- 
мулы (1.3.7) можно определить любой из членов, если известны 
два других. Например, можно вычислить условные вероятности, 
если известны безусловные вероятности и вероятности совмест- 
ного появления пар событий. 

Идеализируем наш пример. Допустим, что события A; и В,, 
А, иВ., А. n B, A, и В. попарно независимы. Тогда в резуль- 
тате опыта мы получили бы в идеальном случае все безусловные 
частости одинаковыми *, как это изображено в табл. 1.3.2. В Ta- 
ком случае частости совместного появления указанных пар со- 
бытий, по формуле (1.3.9), определяются произведением безуслов- 
ных частостей, так как все условные частости тоже одинаковы 
и равны безусловным (табл. 1.3.2). Отсюда следует первое mpa- 
вило, которое полезно запомнить в практических целях. Если 
события в системе независимы, то они равновероятны (их часто- 
сти равны). И наоборот, если для совокупности событий в опыте 
‚получены равные частости появления, то события независимы 
в системе. 

Легко убедиться, что условие независимости событий в CH- 
стеме из двух противоположных событий выполняется и тогда, 
когда безусловные частости для одной пары противоположных 
событий равны между собой, а для другой пары — не равны. 
Например, как показано в табл. 1.3.3, где при изменении часто- 
стей появления событий В, и В. частости появления событий 
А, и А, остаются неизменными. Отсюда второе правило, которое 
danno запомнить. Если хстя бы одна пара противоположных 
событий в системе из двух пар таких событий А,, В; равновероятна, 
то события А; и B; независимы. Ниже мы специально рассмотрим 
вопрос о. формах и мерах зависимости между событиями. 

Вероятность суммы совместных событий Еее по 
одной из следующих формул: 


P (A, +А,) =Р(А,)-+Р(А,) — P (A143), (1.3.10) 


Р(А, А, А.) =Р(А,)+Р (А) + Р (Аз) — 
— [P (AA) EP (АА) EP (AA3)] EP (AAAs), (1.3.11) 


уж _На практике эти частости не одинаковы, но отличаются они друг 
от друга незначимо (см. ст 306). 
р. 
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n n n-1 
Р-Р) X PAA) 
i=1 i=1 j=i+1 ; 

NEF -RFE 

р 5 P (A;A;A}) —- . -+4 1)" P (i 4) (1.3.12) 

1=1 j=i+1 k=j+1 i=1 
Заметим, что формулы (1.3.10)—(1.3.12) выражают вероятность 
суммы совместных событий как суммы вероятностей произведений 
этих событий по одному, по два, по три и т. д. Но возможно и об- 
ратное представление. Вероятности произведений событий можно 
‚вычислить как суммы этих событий по одному, по два, по три. 
ил: 


P (А.А) =Р(А,) Е Р(А)—Р(А,--А,), — (4.3.43) 
Р (А.А. А.) = P (A) EP (А,) ее (Аз) 2E 


— [P (A, + А,) + P (A, + A3) +P (A; + A3)] + P (A, +A, + А.), 
(1.3.44) 


РИА ХР (49-5 У P(A А+ 


1=1 j=i+ 
n-2 n-1 
п-1 
+2 2 у Р(А; -А; А). .+(—1) p($ А; |. (1.3.15) 

i=] j=i+1 =] +1 {=1 j 
Все эти формулы могут оказаться полезными при расчетах 
вероятностей сложных событий. 

Вероятность сложного события, представленного в виде суммы 
произведений простых событий, равна сумме произведений вероят- 
ностей. Пусть имеется событие А, которое может произойти 


вместе с одним из событий B, В., B}, ..., Ba, образующих 
JE 


полную группу ь e. X P (B= 1 | *. Тогда вероятность события А 
| i=1 
определяется по так называемой формуле полной вероятности: 


P(A)= > Р(В)-Р(А/В), - (1.3.16). 


где Р(А/В;). — условные вероятности того, что произойдет собы- 
тие А; если произошло событие В;. Рассмотрим практическое 
применение изложенных правил вычисления вероятностей слож- 
ных событий на примерах. 

Пример 1.3.3. Даны события А, В и С; РА) =0»; RBS 
— 9,3: PG) = 0:2. От этих событий зависит событие D, для KO- 
торого условные вероятности совместного появления с событиями 
А, В и С соответственно равны: Р(О/А) = 0,4; Р(О/В) = P(D/C) 
= 0,3. Требуется определить вероятность появления события D. 

Используем формулу полной вероятности (1.3.16), ко- 
торая в данном случае приводит к следующей сумме произ- 


* События В; часто называют «гипотезами». Все В; «включены» в A- 
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ведений: P(D) = P(A) Р(О/А) + Р(В)Р(О/В) + Р(ОР(О/О = 
= Р(А)Р(О/А) + Р(О/В) [P(B) + Р(С}]; подетавляя заданные 
значения вероятностей и вычисляя, получаем ответ: P(D) = 0,35. 

Пример 1.3.4. Для оформления текста нужно из имеющихся 
технических шрифтов выбрать тот, при чтении букв которого 
люди делали бы меньше ошибок. С этой целью можно сравнить 
вероятности ошибок при чтении любой из букв каждого шрифто- 
вого начертания и выбрать тот шрифт, для которого эта вероят- 
ность наименьшая. 

Факт ошибки при чтении надписи — событие сложное, обу- 
словленное многими обстоятельствами. Чтобы выразить его в виде 
простых событий, введем некоторые упрощающие допущения. 
_ 1. Пренебрежем семантическими связями между буквами, 
словами и фразами текста и будем считать, во-первых, что по- 
явление каждой буквы не зависит от появления других букв, 
и, во-вторых, что для правильного прочтения текста необходимо 
правильно прочесть каждую из составляющих букв. 2. Прене- 
брежем возможностью зрительного анализатора человека к си- 
мультанному восприятию нескольких букв и будем считать вос- 
приятие букв в тексте сукцессивным, т.е. примем, что буквы 
появляются по одной. 5. Будем рассматривать ошибки при чте- 
нии только одной, но любой буквы. При этих допущениях факт 
ошибки при чтении может рассматриваться как сумма несовмест- 
ных ошибок при чтении каждой из букв, появляющихся незави- 
симо друг от друга. Пусть Е, — ошибка при чтении одной (лю- 
бой) буквы текста, оформленного Ё-тым техническим шрифтом 
из числа проверяемых, а D; — ошибка, состоящая в том, что 
появляющуюся Г-тую букву человек читает ошибочно. Тогда 
на основе сказанного | 


E= D, +D, + Ба DeD (1.3.17) 


i=1 
Вероятность этой суммы равна сумме вероятностей слагаемых: 


P (E}) = 2 P (D). (1.3.18) 


Обозначим факт появления İ-TOÏ буквы в тексте как событие А,, 
а вероятность А; — как P(A). Кроме того, так как в различных 
технических шрифтах заглавные и строчные буквы обычно разли- 
чаются по начертанию, введем в рассмотрение событие В, состоя- 
щее в том, что Гтая буква является заглавной, и событие С, CO- 
стоящее в том, что это строчная буква. Вероятности этих CO- 
бытий — P(B) и P(C) соответственно. Появление конкретных 
букв и то, что эти буквы суть заглавная или строчная, никак 
не связаны между собой. Поэтому события А;, В и С попарно 
независимы, а факты появления заглавной или строчной {-той 


37 


буквы следует рассматривать как произведения независимых 
событий, вероятности которых соответственно равны: 


P (A,B) =Р(А)-Р(В} и Р(АС)=Р(А)-Р(С). (1.3.19) 


Напротив, ошибка в прочтении буквы обусловлена как фактом 
ее появления (нельзя ошибиться в прочтении буквы, которую не 
_ видел!), так и вариантом начертания — строчным или заглавным. 
Поэтому события D; и А, В, и D; и А.С попарно зависимы. Cego- 
вательно, вероятность ошибки в случае появления заглавной 
[-той буквы — обозначим ее P(D;/B) — должна определяться 
как произведение вероятности появления 1-той заглавной буквы 
Р(А;В) на условную вероятность ошибки в этом случае Р(О;/А;В): 


P (D,B) =P (A;B) - P (D;,/A;B). — (4.3.20) 
Аналогично, в случае появления строчной {-той буквы 
POJO PAO P OJAO: A (1.3.24). 


В силу несовместности событий В и С, вероятность ошибиться 
при чтении заглавной или строчной {той буквы, обозначим ее 
Р(О;), есть сумма вероятностей несовместных событий: 


P (D) =Р(О,/В)--Р(О,/С). (1.3.22) 


Подставляя в (1.3.22) значения слагаемых и сомножителей из 


(1.3.19), (1.3.20) и (1.3.21), запишем: 
P (D;) =P (А) -[Р (В) P (D;/A;B) + P (C) P (D;/A;0)1. (1.3.23) 


Подставляя уравнение (1.3.23) в уравнение (1.3.18), оконча- 
тельно получаем формулу интересующей нас вероятности ошибки 
при чтении одной (любой) буквы в тексте, с учетом принятых 
допущений: 


P (Ea) У P (A;) - [P (B): P (D;/A;B) + P (C)+ P (D;/A;C)]. (1.3.24) 


Введя еще одно допущение, а именно, что буквы текста читаются 
человеком при дефиците времени, можно моделировать интере- 
сующую нас ситуацию в эксперименте с тахистоскопическим 
равновероятным предъявлением в случайном порядке отдельных 
букв из числа алфавита определенного шрифтового начертания; 
каждая Г-тая. буква дается в двух вариантах — заглавном и 
строчном. При коротких экспозициях, создающих дефицит вре- 
мени, восприятие буквы затрудняется. Такой эксперимент про- 
водился для нескольких технических шрифтов и 30 букв алфа- 
вита. В результате были определены оценки вероятностей 
p(D;:/A;B) и p(D;/A;C), приведенные в табл: 1.3.4 для заглавного 
.и строчного вариантов двух шрифтов — стандартного и архи- 
тектурного, сравнением которых мы ограничимся в данном при- 
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Таблица 1.3.4. 
EATE вероятноетей TA p (D;/Ai B) и р(О;/А;С) 


Пояснения см. в тексте примера 1.3.4. 


Шрифты 


2a Буквы р ( A;) * Стандартный Архитектурный 


p (2;/^А;В) | Р(Р./АЮ) | Р(Р/А;В) | Р(Р/АЮ) 


А 0,060 0,355 0,100 - 0,372 0,300 
р: 0,010 0,193 0,300 0,096 0,300 
A В 0,036 0,000 0,000 0,248 0,496 | 
ть 0,009 0,000 0,284 | 0,514 0,142 
5 + Д 0,024 0,029 0,245 0,116 0,098 
6 | Е 0,076 0,111 0,048 0,111 0,178 
T- |- Æ 0,006 0,249 0,332 0,249 0,166 
TE E 0,014 0,200 0,000 0,141 0,200 
о и 0,074 0,000 0,528 0,442 | 0,096 
10 | К 0,057 |° 0,425 0,000 0,000 0,333 
м | Л 0,036 0,310 _| 0,423 0,248 0,287 
12 | М 0,027 0,200 0,000 0'200 0,666 
13| H 0,060 0,074 0,249 0,284 0,166 
ВЕ 0,096 0,055 _ 0,071 0,230 0,568 
45.9 0,028 _ 0,000 0,249 0,200 0,646 
16. |. Р 0,044 0,000 0,000 0,286 | 0,250 
17 |- С 0,044 0,259 0,285 0,296 | 0,442 
18 | Т 0,061 0,082 0,124 0,287 0,432 
19. | У | -0,020 0,186 0,135 - 0,372 0,360 
a > Ф 0,005 0,000 ` 0,000 0,330 0,500 
Ех 0,011 0,000 0,000 0,083 0,750 
22.4 0,004 0,166 0,120 0,664 0,200 
T Ч 0,014 0,000 0,143 0,498 0,143 
4 | Ш 0,005 0,100 0,133 0,200 0,386 
25 | Щ 0,004 0,090 0,231 ‚ 0,270 | 0308 
5 Di 0,018 0,066 0,443 ^ |. 0,488 1,000 
в 0,011 -0,000 0,000 0,000 0,286 
8 | 9 | 0005 0,120 0,462 0,040 0,077 
29 | Ю 0,009 0,000 0,166 0,500 0,498 
30 | A 0,019 0,066 0,333 0,132 0,333 


* Оценки р (А;) округлены до тысячных.. 


мере. Вероятности Р(А;) для всех букв алфавита в реальных 
текстах отнюдь не одинаковы. Также различаются и вероятности 
P(B) и P(C). Можно уточнить значения этих вероятностей, BOC- 
пользовавшись данными статистического анализа русских TeK- , 

стов. 
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В качестве оценок вероятностей появления букв в тексте 
воспользуемся данными Д. С. Лебедева и В.А. Гармаша о me- 
зависимых вероятностях графем русского языка, определенных 
на смешанных текстах *. Эти вероятности также приведены в та- 
блице 1.3.4. Данные о лингвистической вероятности заглавных 
и строчных букв в русских текстах нами в литературе не обна- 
‘ружены. Поэтому попытаемся получить оценку для интересу- 
ющих нас вероятностей косвенным путем, а именно, используя 
данные о средней длине слова (в буквах) и о средней длине фразы 
(в словах). Для большинства общенаучных и художественных 
текстов количество ноявлений заглавной буквы He меньше коли- 
чества появлений законченной фразы (предложения), так как 
фраза всегда начинается с заглавной буквы. Конечно, в научных 
текстах встречаются специальные условные обозначения в виде 
заглавных русских букв, а в художественных эти буквы встре- 
чаются в начале имен собственных. Поэтому оценка р(В) только 
по числу законченных фраз представляет собой оценку снизу. 
Но в первом приближении мы ею воспользуемся. | 

Пусть во фразе п букв, тогда количество заглавных букв. 
равно 1, а в строчных n — 1. Соответственно вероятность появле- 
ния заглавной буквы равна 1/n, а строчной n — 1/n. По данным, 
приводимым H. Д. Андреевым, средняя длина слова для худо- 
жественных, общенаучных и технических текстов составляет CO- 
ответственно 9 и 6,9 буквы **. Средняя длина фразы для тех же 
текстов составляет соответственно 20,3 и 19,8 слова ***. Можно, 
усреднив эти данные, принять, что для указанных текстов сред- 
няя длина слова составляет 6 букв, а средняя длина фразы — 
20 слов. Отсюда среднее количество букв во фразе тех же тек- 
стов — это 120 букв. Тогда p(B) = 1: 20 ~ 0,008, p(C) = 1149: 
: 120 ~ 0,992. Используя эти значения и оценки условных Be- 
роятностей из табл. 1.3.4, по уравнению (1.3.24) мы рассчитали 
вероятности p(E,) и р(Е,) соответственно для стандартного 
и архитектурного шрифтов ****. Промежуточные величины при- 
ведены в табл. 1.3.5 и 1.3.6. Окончательные значения вероятно- 
стей р(Е/) = 0,134 и р(Е,) = 0,286 показывают, что ошибки 
при чтении букв стандартного шрифта менее вероятны, и следо- 
‘вательно, для оформления текста лучше использовать стандарт- 
ный, а не архитектурный шрифт. 

Пример 1.3.5. В примере 1.1.3 мы рассматривали вероятность 
события А, состоящего в том, что человек-оператор, контролируя 
показания приборов, размещенных на приборной панели опти- 


* Н.Д. Андреев. Статистико-комбинаторные методы в теоретиче- 
ском и прикладном языковедении. «Наука», 1967. (См. Приложение Г, таб- 
лица 1, стр. 226). 

** Там же, таблица 44, стр. 247. 

*** Tam же, таблица 65, стр. 260. | 
_ **** Мы выполняли промежуточные расчеты с точностью до шестого 
знака справа от запятой. 
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Таблица 1.3.5 
Стандартный шрифт 


Буквы р (B): p (D;/ A;B) p (C). p (D; /A;0) : 21 и? р CARIE 2 
А - 0,002840 _ 0,099200 0,102040 0,006122 
Б 0,001544 0,297600 0,299144 0,002991 
B 0,000000 0,000000 0,000000 0,000000 
£ 0,000000 0,281728 0,281728 0,002536 

A 0,000232 0,243040 0,243272 0,005838 
E 0,000888 0,047616 0,048504 0,003686 

sK 0,001992 0,329344 0,331336 0,001988 
3 0,0041600 0,000000 0,001600 0,000022 
И. 0,000000 0,523776 0,523776 0,038759 
К 0,001000 0,000000 0,001000 0,000027 
JI 0,002480 0,122016 0,124496 0,004482 
M 0,001600 0.000000 0,001600 0,000043 
H 0,000568 0,247008 0,247576 0,014855 
O 0,000440 0,070432- 0,070872 0,006804 
П 0.000000 0,247008 ‚ 0,247008 0,006916 
P 0,000000 0,000000 0,000000 0,000000 
C ’ 0,002072 0,282720 0,284792 0,012531 
ii - 0,000656 0,123008 0,123664 0,007544 
Е 0,001488 0,133920 0,135408. 0,002708 
Ф 0,000000 0,000000 0,000000 0,000000 
X 0,000000 0,000000 0,000000 0,000000 
Ц 0,001328 0,149040 0,120368 0,000481 
4 0,000000 0,141856 0,141856 0,001986 
Ш 0,000800 0,131936 0,132736 0,000664 
Щ 0,000720 0,229152 0229872. 0,000919 
Ы 0.000528 0,141856 0,142384 0,002563 
b 0,000000 0,000000 0,000000 0,000000 
Э 0,000960 0,485304 0,459264 0,002296 
IO 0,000000 0,164672 0,164672 0,001482 
Я 0,000528 0,330336 0,330864 0,006286 


P (Естандь) = 0,134529 > 0,134 


мальных размеров (см. рис. 1.1.4), посмотрит на один из приборов. 
Установлено, что Р(А) = 0,019, если считать положение при- 
бора в любом участке площади панели равновозможным, а также 
считать равновероятными осмотры любого участка панели. Но 
эти упрощающие предположения на практике не выполняются. 
Поэтому в данном примере введем усложняющие вопрос обетоя- 
тельства: неравновероятное расположение приборов и неравно- 
вероятное ‘перемещение глаз оператора по приборной панели. _ 
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Архитектурный. шрифт 


Таблица 1.3.6 


Буквы | P (B)-p(D;/A;0) p (C)- p (D;/A0) Zinz2 P (А1) 1 из 
А 0,002976 0,297600 0,300576 0,018035 
B 0,000768 0,297600 0,298368 0,002984 
B 0,001984 0,492032 0,494016 0,017785 
Г 0,004112 0,140864 0,144976 0,001305 
Д 0,000928 0,097246 0,098144 0,002355 
E 0,000888 0,176576- 0,177464 0,013487 
IK 0,001992 0,164672 0,166664 0,001000 
3 0,001128 0,198400 0,199528 0,002793 
И 0,003536 0,095232 0,098768 0,007309 
К 0,000000 0,330336 0,330336 _ 0,008919 
Л 0,001984 0,284704 0,286688 _ 0,010324 
М 0,001600 0,660672 0,662272 0,017881 
H 0,002272. 0,164672 0,166944 0,010017 
O 0,001840 0,563456 0,565296 0,054268 
П 0,001600 0,640832 0,642432 0,017988 
Р 0,002288 0,248000 0,250288 0,011013 
C 0,002368 ` 0,140864 0,143232 ‘0,006302 
T 0,002296 0,428544 0,430840 0,026281 
y 0,002976 0,357120 _ 0,360096 0,007202 
Ф 0,002640 0,496000 0,498640 0,002493 

“X 0,000664 0,744000 0,744664 0,008191 
Ц 0,005312 0,198400 0,203712 0,000815 
y 0,003984 0,141856 0,145840 0,002042 
Ш 0,001600 0,382912 0,384512 0,001923 
Щ 0,002160 0,305536 0,307696 0,001231 
Ы 0,001504 0,992000 0,993504 0,017883 
Ъ 0,000000 0,283712 0,283712 0,003121 
9 0,000320 0,076384 0,076704 -0,000384 
Ю 0,004000 0,494016 0,498016 -0,004482 
f 0,001056 0,330336 0,331392 0,006296 


p (Eapx) = 0,286106 ~ 0,286 


Разобъем всю панель на части — квадранты, перенумерован- 
ные, как показано на рис. 1.1.4, и введем событие В; — распо- 
ложение прибора в одном из квадрантов (i = 1, 2, 3, 4): соответ- 
ственно есть события B, В., В. и Ва. 

Вероятность прибору очутиться в одном из квадрантов опре- 
делим геометрически как отношение площади 1-го квадранта 
‚к общей площади приборной панели. При этом учтем, что пло- 
щади квадрантов 1 и 2, а также 3 и 4 попарно равны (см. рис. 1.1.4). 
Ноэтому P (BoA РАВ.) = 3060: {16728 = "0153; РВ 
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= P (Ba) = 5304 : 16728 ~ 0,317. Можно определить. эти вероят- 
ности, рассуждая иначе. Очевидно, прибор обязательно располо- 
жен в одном из четырех квадрантов, поэтому события B, В.,. 


В. и В, образуют полную группу событий, и УР (В) = 1. Так 
i 


как суммы площадей «правых» и «левых» квадрантов (CM. pas: 
1:1.4) равны, то -P (Bi) + P(B) = P (B) + P (B3) = 

Вычислив через отношение площадей любую из P (Bə), = 
ляем другую, как дополняющую P (B) до 0,5. | 

Рассмотрим далее событие С;, состоящее в том, что первым 
(по времени осмотра) будет осмотрен Г-тый квадрант. Соответ- 
ственно, есть события С, Gə, С., C4, которые также образуют 
полную группу. Как показывают эксперименты, частости первого 
«скачка» глаз в определенный квадрант весьма неодинаковы: 

pG =.0,:295; р (С). 0,615: ре.) = 0,060. р (©) = 0:030*: 

Введем в. рассмотрение еще и второй «скачок» глаз человека- 
оператора — событие Д),, состоящее в том, что вторым будет 
осмотрен 1{-тый квадрант; ‘соответственно есть события ПЕ 
и 0).. Вероятность направления второго «скачка» глаз оператора 
а от того, в каком направлении осуществлен первый «ска- 
чок». Если первый «скачок» был в ЁГтый квадрант, то второй 
ря в тот же квадрант — событие невозможное; поэтому 

P (Вис) =0, P (D/C) = 0, P (D 3/03) = 0, P (D4/C,) = 0. Осталь- 
ные условные вероятности событий D; при условии, что имели 
место события Cj, приведены на рис. 1.3.1. Отметим, что все 
возможные комбинации событий D; при условии появления каж- 
дого из событий С; составляют полную группу. 

Все перечисленные события можно изобразить в виде «дерева» 
или графа исходов, подобно тому, как это сделано для примера. 
1.2.1 (см. рис. 1.2.1). Но в данном случае’ «дерево» оказывается 
слишком «ветвистым» (96 исходов). Мы поэтому изобразили на 
рис. 1.3.1 только часть возможных исходов. Изображение исходов 
опыта в виде графа очень наглядно и удобно для подсчета вероят- 
ностей всех интересующих исследователя событий. В связи с этим 
несколько поясним рис. 1.3.1. Кружками (прямоугольниками 
и т. п.) обозначаются события; линиями (стрелками) — связаны 
совместные события. Ряд совместных событий, объединенный 
линиями, образует ветвь (или цепь) и представляет собой исход 
опыта. Общее количество исходов определяется по числу ветвей. 
События подразделены на «уровни» (или «шаги») и «группы». 
Внутри «уровня», а также внутри группы события образуют 
полную группу событий. Поэтому сумма вероятностей этих собы- | 
тий равна единице. Вероятности обычно подписывают на стрел- 
ках или над событиями, как на рис. 1.3.1. Слева целесообразно 
записывать для каждого уровня перечень соответствующих 
событий. 


*В. Гайда, Ю.А. „Гаптев.. О ' структуре маршрута движения 
глаз. В сб. : Проблемы инженерной психологии, вып. 2, М.,. 1968, стр. 248. 
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Рис; ЦЗ. Граф исходов примера 1.3.5. 
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Поясним два события, представленные на рис. ERI которые 
выше не рассмотрены. Исходное состояние обычно обозначают «О». 
Его вероятность Р (0) =1. В сущности, исходное состояние 
может быть каким-то случайным событием среди группы других 
событий, с вероятностью Р (0) < 1, т. е. можно в качестве исход- 
ного принять любое из событий А, В ит. п., дающих начало 
новому ветвлению. Рассмотрим событие А. Если событие А, как 
обозначено выше, состоит в том, что человек-оператор посмотрит 
на прибор, расположенный среди других на приборной панели, 
то противоположное ему событие А состоит в том, что человек- 
оператор не посмотрит на этот прибор: P (А) + P (А) = 1, и так 
как. Р (А) = 0,019, то P(A =1—0,019 = 0,984. 

Теперь займемся вычислением некоторых вероятностей. При’ 
этом будем называть событием %; какое-либо сложное событие, 
состоящее из простых событий графа исходов (рис. 1.3.1). 

1. Пусть событие Е; состоит в том, что человек-оператор 
посмотрит на прибор, расположенный в том квадранте. При этом. 
будем, как и в примере 1.1.3, предполагать вероятности направле- 
ния «скачка» глаз в любой из квадрантов одинаковыми. Легко - 
видеть, что событие Е; представляет собой произведение двух 
совместных независимых событий А и В; (где i = 1, 2, 3, 4). 
| Поэтому P (Е;) — вероятность посмотреть на прибор, располо- 
женный в #том E панели оптимальных размеров, pan 

P (Е) =P (A) -P (B). 
Подставляя в это уравнение значения соответствующих вероят- 
ностей, получаем: P (Е!) = 0,019-0,183 = 0,0035; P (E. = 
= 0,019. 0,0483 = 0,0035; Р (Е) — 0,019. 0,317 — 0,006; РЕ.) = 
= 0,049-0,317 = 0,006. 

)Заметим, что JZP (Е;) = 0,019 *. Этого и следовало ожидать, 
так как вероятности P (Е;) представляют собой части Р (А) так 
же, как события E; — «части» события А — включены в А. ** 

2. Пусть событие Е, состоит в том, что -человек-оператор 
посмотрит на прибор (событие А), расположенный в i-TOM квад- 
-panre (событие В;), при условии, что первым будет осмотрен. 
[-тый квадрант (событие С;). Иначе говоря, событие F; можно 
рассматривать как совместное появление событий Е; и t. или, 
дезукруйняя событие Е;, как произведение событий ABC. Таким 
образом, здесь возможны следующие шестнадцать событий: 

1) АВС, - 5) АВ.С, 9) АВ.С, 13) АВ.С, 
‚ 2) АВС. 5) АВ... W АВ. 14 АБВ.С. 
3) АВС, 7) ABG; 144) АВС, № АВС, 
4) АВ.С, 8) АВ.С, 12) ABC, 16) АВ.С, 


+ ХРЕд- JP (A): P (B)=P (A): X P (B)= P(A). 


1 
** Здесь отметим, YTO если cobai B включено B А, т. e. из В следует А, 
TO- P (B) < P (A), причем равенство достигается лишь npa A=B 
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ты - 


Из них на рис. 1.3.1 изображены только события 5—8, остальные 
не показаны. Вероятности этих сложных событий определяются 
как произведения вероятностей событий-сомножителей. Заме- 
‚тим, что сумма: всех Mooren вероятностей снова должна быть. 
равна PAJ в. e 


> P, (АВС, =P (A). 


Kpome TOTO, 


4 8 
à Pi (AB‚C;) =P (E), È P; (АВ.С;) = P (E3), 


16 


È P, (ABC) =P (E3), È P; (AB,C) =P (Œ) 


Эти равенства должны выполняться по условиям включения собы- 
тий (см. сноску ** на стр. 45), они _ нужны для проверки правиль- 
ности вычислений. 

Вычислим вероятности события F, при j = 5 — 12; остальные 
вероятности будут равны этим из-за <симметричности правой и ле- 
вой половин приборной панели. _ 


п квадрант 1 квадрант 


P (F5) =0,0010 P (Е!) =0,0010 
P (Ев) = 0,0022 P (F2) = 0,0022 
P (F7) = 0,0002 P (F3) = 0,0002 
P (F8) = 0,0001 $ РЕ =0,0001 _ 
ЕР E с 
УР(Е)=0,0035 УР(Е,) =0,0035 (1.3.25} 
1=5 ` j=1 | 
ПТ квадрант . | ТУ квадрант 
P (F9) =0,00477 P (F13) = 0,00177 . 
P (F10) = 0,00370 P (F14) = 0,00370 
P (F11) = 0,00036 P (F15) = 0,00036 
P (F12) — 0,00018 P (F16) =0, 00018 
j=12 j=16 | 
s У Р(Е)=0,0060 У, Р(Е) =0,0060 
j=9 r j=13 


3. Пусть событие H, состоит B TOM, что человек-оператор 
посмотрит на прибор (событие А), расположенный в #том квад- 
ранте (событие В;) при условии, что, вторым (событие D;) после 
первого (событие С;) будет осмотрен {-тый квадрант. Событие H, 
можно рассматривать как произведение событий ЁЕ,.О,. Всего 
‘таких произведений 48, но 16 из них — невозможные события, 
т. €. те, в которых сомножители C;D; имеют одинаковые номера 
(i = j). Для вероятностей Р(Н,) можно сформулировать прове- 


рочные требования, аналогичные таковым ДлЯ вероятностей _ 
Е=4 = 


P (Е) иР (Е). Например, > Р(Н,) =P (F,), S Phe 
| абы В=5, kRÆ6 
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= P (F,), ит. д. Вычислим вероятности P (H ,) для двенадцати. 
событий Н,, представленных на рис. 1.3.1: 


H4 = F;D, Hi; = FD; Hai = FD, H, = FD; 

His = FD; Hio = F.D; H. = FD, Has = FD- 

His =F;D; Но=Е О. Ha =F:D;, Hy = FD}. 
Подставляя значения ‘соответствующих вероятностей и часто- 


стей из (1.3.25) и нижнего уровня графа событий (рис. 1.3.1), 
получаем: | | 


P (Н14) =0,00035 P (H17) =0,00063 
P (Н1ь) = 0,00004 P (H19) = 0,00152 
P (H16) = 0,00061 P (H20) = 0,00005 
ати A А k=20 
У P (Hx) =0,0010 = P (F5). У P (Hg) =0,0022=P (Fe) 
k=14 k=17, k18 
P (H21) = 0,0000066 P (H25) = 0,0000500 
P (H22) = 0,0001300 P (H26) = 0,0000067 
P (H24) = 0,0000634 P (H27) = 0,0000433 
TER PT V TE ER A EE AEA Я: Е E 
P (Hg) =0,0002=Р (F7) У P (Hg) =0,0001 =P (F3). 
Е=21. R23 k=25 


4. Определим вероятность взглянуть на нужный прибор 
с первого «скачка» глаз. Эта вероятность складывается из четырех 
слагаемых: P(I) = P (ABC) - Р(АВ.С,) +P (АВС) + 
+ P (АВ.С.), где P (ABC) — вероятность того, что с первого 
«скачка» глаз будет обнаружен прибор, расположенный в первом 
квадранте; P (ABC) — вероятность взглянуть с первого «скачка» 
глаз на прибор во втором квадранте; P (ABC) — то же в третьем 
квадранте; P (АВ.С.) — в четвертом квадранте. | 

Вычисляя вероятности произведений по данным рис. 1.3.1, 
соответственно, получаем: P (I) = 0,00100 + 0,00214 + 0,00036 + 
-0,00018 = - 0,00368. 

5. Определим вероятности взглянуть с первого «скачка» 
глаз на прибор, расположенный в правой половине и в левой 
половине приборной панели; в ее верхней и нижней части. 
`, Р (прав.) = P (АВ: )-ЕР(АВ.С.) =0,00113, Р(лев.) =Р(АВ.С.)-= 
PAB: = 0.00250. /Р›(верх) = Р(АВ:С.) F P(B) = 
= 0,00314, P (низ) = P (ABC) + P (АВ,С.) = 0,00054. 

6. Определим вероятность взглянуть Ha ‘прибор только со 
второго «скачка» глаз (P (11)). Эта вероятность тоже состоит из 
четырех слагаемых: P (I1) = P (D/B) +P (0./В,) + P (D/B) + 
+ P (D,/B4), где каждое из слагаемых, в свою очередь, есть сумма 
трех слагаемых: Р (0:/В1) = Р (АВ.С.0,) - P (ABCD) ++ 
+ P (ABCD) — вероятность вторым «скачком» глаз взглянуть 
на прибор в первом квадранте. Так как второй «скачок» глаз имеет 
специфическую условную вероятность, в зависимости от того, куда 
был направлен первый «скачок», то рассматриваемая вероятность 
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_и суммируется из трех соответствующих вероятностей. Ана- 
логично: P (Р./В,) =< (ABD) -- Р(АБВ.С.О.) + 
+ P (ABCD), P (В = -P (AB;C:D} +. P (ABCD) + 
+ P (AB:C,D;), P (РиВ.) P (АВ.С:0.) + P (AB,C,D,) + 
+ P (AB,C;D,). 

Вычислив указанные вероятности, окончательно получаем: 
P (11). = 0,00079 + 0,00049 + 0,00270 + 0,00128 = 0,00526. 
< 7. Теперь можем определить вероятности посмотреть Ha при- 
бор за первые два «скачка» глаз и посмотреть за большее, чем 
два количество «скачков». Вероятность посмотреть на прибор за 
первые два «скачка» глаз определяется как сумма несовместных 
событий: РЕП) = Р(О-ЕР(П = 0,00368 - 0,00526 —. 
— 0,01. Вероятность посмотреть на прибор за большее, чем два 
количество «скачков» глаз определяется как вероятность противо- 
положного события: P (I + II) = 14 — 0,01 = 0,99. 

Заканчивая пример, подчеркнем еще раз два обстоятельства. 
Первое — по графу исходов рассчитываются вероятности любых 
сложных событий. И второе — эти вероятности вычисляются по 
формуле полной вероятности на основе вероятностей (безусловных 
и условных) простых событий. 


I 


1.3.2. Ранжирование событий в системе по вероятностям 


Если события в системе не равновероятны, то вероятность 
можно рассматривать как характеристику значимости события, — 
конечно, только в смысле возможности появления и только в дан- 
ной системе событий, образующих полную группу. В этом смысле 
и говорят о вероятностном «весе» события (или о «весе» по вероят- 
ности) *. События с большой вероятностью имеют большой «вес», 
а события с малой вероятностью. — малый «вес». При геометри-. 
ческом изображении вероятностей событий аналогия с весом в его 
обычном понимании достаточно полная. Эта аналогия основывается 
на привычке оценивать физический вес предмета по его зрительно 
воспринимаемой величине. Поэтому-то геометрически большая 
площадь и ассоциируется в нашем представлении с большим весом 
фигуры. «Вес» события является одной из важнейших его характе- 
ристик в системе событий, поскольку по «весу» события в системе 
можно сравнивать и упорядочивать. Часто из большого числа 


событий представляют интерес не все, а лишь достаточно частые 
события. . 


* B смежных науках, используемых в психологической практике, 


понятие «вес» многозначно. Используются: «вес» в смысле субъективной или 
объективной ценности (теория игр), в смысле стабильности результатов 
измерения от опыта к опыту (теория вероятностей, метрология), в смысле 
количества информации. В частности, понятие информационного «веса» со- 
общения (рассматриваемого как событие) прямо противоположно по смыслу 
понятию вероятностного «веса», так как количество информации, несомой 
событием, тем больше, чем меньше вероятность этого события. 
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Наиболее вероятное событие (или класс событий) в системе 
называется модальным. событием (классом) или просто модой. 
Исключив из рассмотрения моду, среди остальных событий можно 
найти новое модальное событие, затем среди оставшихся — новую 
моду и т. д. Таким путем все события в системе можно упорядо- 
чить (ранжировать) по убыванию их вероятности. Ранжирование | 
можно выполнить и по возрастанию «веса» событий. После Timar 
рования событиям присваиваются порядковые номера * (или 
ранги), которые приближенно характеризуют (в числах натураль- 
ного ряда) возможности появления событий в системе. Ранжиро- 
ванные по вероятности события удобно представлять графически 
в виде столбиковых и круговых диаграмм распределения вероят- 
ностей. 

Пример 1.3.6. В табл. 1.3.7 представлено распределение ди- 
агнозов психически больных людей, обследованных при изуче- 
нии расстройств мышления **. Можно видеть, что среди девяти 


Таблица 1.3.7 
Распределение (исходное) больных по диагнозу i 


Диагноз (заболевание) ее 
р 
Шизофрения . 0,25 
Эпилепсия . 0,07 
Сосудистые заболевания головного мозга. 0,22 
Травмы головного мозга . > 0,26 
Олигофрения . 0,06 
Энцефалиты 0,04 
Прогрессивный паралич > 0,04 
Маниакально-депрессивный. психоз : 0,02 
Пеихолатии я. у 0,04 


заболеваний равновероятными являются только три; остальные 
‚существенно не равновероятны. Модальный диагноз — травмы го- 
ловного мозга, на втором месте (по убыванию вероятности) — шизо- 
френия, на третьем — сосудистые заболевания головного мозга. 
Эти три диагноза имеют место с вероятностью (суммарно) более 
*/з, тогда как остальные шесть диагнозов — только 1/.. Ранжиро- 
вав все диагнозы по убыванию вероятностей, получаем табл. 1.3.8, 
из которой хорошо видны сравнительные «веса» каждого из девяти 
диагнозов. Отметим, что энцефалиты, прогрессивный паралич 
и. психопатии, которые равновероятны, получили ранг, равный 
среднему из рангов (6, 7 и 8), которые бы они занимали, будучи 
неравновероятными. 


* Если два или более событий равновероятны, то им присваивается 
одно и ТО Же среднее значение из порядковых номеров, которые они бы полу- 
чили, будучи не равновероятными. 

tr m B. В. Зейгарник. Патология мышления. Изд. МГУ, 1962, 
стр. 
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Таблица 1.3.8 
Ранжированное Зари реденение больных по диагнозу 


Оценка Ранг 
Диагноз (заболевание) вероятности по вероятности 
‚< Травмы головного мозга......... 0,26 1 
Шизофрения .... 0,25 2 
Сосудистые заболевания толовного мозга 0,22 3. 
Эпилепсия . О a e ес НОЖИ 0,07 4 
Олигофрения . аа, ме 0,06 D 
Энцефалиты . E E ee E ЗЫ |. 0,04 7 
Прогрессивный паралич : и 0,04 T 
Психопатии 0,04 7 
Маниакально-депрессивный. психоз. 0,02 9 
‚ 0,4893 
г 072 
а; res T &. 
| [ класе ` 
0,281 a 0,23 Е 
0,783° 
0,80 
0,053 
я а 
=] Е 3 Ая | a 0.20 1 класс 
Са, 
0.32 Ш класс 
3 kes] 
0,93 
Рис. 1.3.2. Диаграммы распределения ' [У класс 
вероятностей «классифицированных» CO- ADR 
бытий. 002 
а — столбиковая; б — круговая. Ранги соот- 
ветствуют.суждениям ‘из табл. 1.3.9. | еек 
Рис.1.3.3. Последовательность столби- А А 


ковых диаграмм к примеру 1.3.8. 


Пример 1.3.7. В табл. 1.3.9 представлены ранжированные 
по вероятности суждения взрослых людей (восемь лет тому назад 
окончивших школу), характеризующие внешний облик школьных 
учителей.*. Изобразим эти же данные в виде диаграмм распре- 


* См. А. А. Бодалев. Восприятие человека человеком. Изд. ЛГУ, 
1965, стр. 15. | 
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деления вероятностей. Столбиковая диаграмма представлена на 
рис. 1.3.2, ‘а, PIDRIA столбиков, соответствующих событиям, 


Таблица 1.3-9 
К примеру 1.3.7 | 


Ранг 


по вероятности 


f $ Оценка 
Суждения, характеризующие: . вероятности 


Физический облик. Го _ 0,483 4 
Мимику и пантомимику ......... 0,281 2 
Вненноств в целом: или. 0,183 3 
Оформление внешности. ......... 0,053 4 


пропорциональны оценкам вероятности из табл. 1.3.9. Расстоя- 
ния между столбиками могут быть произвольными, но лучше их 
располагать на одной горизонтали, а слева, или справа’ * mo- 
местить вертикальную ось, градуированную в долях для удобства 
чтения диаграммы. Столбики обозначаются буквами или рангами, 
как на рис. 1.3.2, а. Круговая (или секторная) диаграмма изо- 
бражена на рис. 1.3.2, 6. Ее преимуществом является компакт- 
ность, но при большом количестве событий в системе (практи- 
чески больше пяти) это преимущество становится недостатком. 
Столбиковые диаграммы легко располагать друг под другом, 
для того чтобы наглядно представить изменение вероятностного 
«веса» изучаемых событий под влиянием какого-либо контроли- 
руемого условия. | 
Пример 1.3.8. Известно, что младшие школьники предпочи- 
тают более сложные и трудные задания более легким. Степень 
предпочтения увеличивается при переходе от первого класса 
к четвертому; это показано в табл. 1.3.10. ** Изобразим изменения 
степени предпочтения в выборе трудной задачи школьниками 
первого — четвертого классов в виде последовательности столби- 
ковых диаграмм, как показано на рис. 1.3.3. 
Таблица 1.3.10 


Вероятноети выбора трудной и легкой задачи младшими школьниками 


и наро топе" Зита T и-нет RT ПИ: НЕВЕ ЕО по ETE т ЕО ЕЕ Ио EE ae 


| Классы 
Выбор задачи ЕЕ СИ рае и ОБД РЕ доке кр РУБ 
I | II III | _ У 
Трудной (событие А) 0,77 0,80 0,68 0,93 
Легкой (событие A) 0,23 0,20 0,32 | 0,07 


* Если столбиков много, шкалу для отсчета вероятности помещают 
и слева, и справа. Часто вместо шкалы отсчета K сверху над столбиками ука- 
зывают значения вероятностей. 
** CM. Л. И. Божович. Личность и ее формирование в детском 
возрасте. «Просвещение», 1968, стр. 251. 


= 


4% _ 54 


1.3.3. Меры связи между классифицированными событиями 


Зависимость (связь) * между случайными событиями, как 
указывалось, сестоит в том, что появление одного из событий 
изменяет вероятность появления другого события. Иначе говоря; 
факт связи между случайными событиями состоит в совместном 
изменении меры возможности их появления — частоты, частости 
или вероятности. По наличию или отсутствию такого изменения 
и судят о наличии или отсутствии зависимости между событиями. 


а 


События | А | А | P(B) 

В 0,4 | 0,0 | 0,4 

В 0,0 | 0,6 0,6 

P (А) 0,4 | 0,6 1,0 

6 B 

События | А А | 2 | ‘События | А | А | Р(В) 
B 0,3 | 0,1 | 0,4 ; p- d eoz] pi 
B 01 | 05| 0,6 REI 0,5 | 01| 0,6 
P (A) 0,4 | 06 | 10 P (A) 0,6 | 04 | 10 


Рис.1.3.4. Сопряженность «классифицированных» событий. 
а — максимально тесная положительная; б — положительная; в — отрицательная. 


{ 


Связь по вероятностям не является однозначной. Поэтому, 
в отличие от детерминированных связей, связи между случай- 
ными явлениями вообще называются вероятностными (стохасти- 
ческими) связями. Стохастическую связь между «классифициро- 
ванными» событиями часто называют сопряженностью. 
Сопряженность ** имеет три свойства: тесноту (степень, силу), 
направление и направленность. ХГеснота сопряженности — это 
основное свойство. Она тем больше, чем более неравновероятно 
совместное появление всех зависимых в совокупности событий. 
Если все события (или по крайней мере одна пара событий) в си- 


^ 


* В литературе по теории вероятностей чаще используется термин 
«зависимость, а в литературе по статистике и ее приложениям — термин 
«связь. Здесь и дальше мы употребляем оба термина как синонимы. 

** Используя лаконичный термин «сопряженность», мы везде будем 
иметь в виду более точное, но длинное выражение: «стохастическая связь 
между классифицированными событиями». 
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стеме равновероятны, то, как показано выше, сопряженность 
отсутствует (нулевая» теснота). Если вероятности некоторых 
событий в системе равны нулю, а других не равны, то теснота 
максимальна, и связь вероятностная превращается в детермини- 
рованную (рис. 1.3.4, а). Между этими крайними случаями рас- 
полагается множество случаев сопряженности, теснота которой 
непрерывно изменяется от нуля до некоторой максимальной вели- 
чины, количественное выражение которой может быть различно. 

Направление сопряженности определяется характером рас- 
пределения вероятностей совместного появления событий. Если 


вероятности совместного появления событий АВ и АВ больше, 


чем вероятности совместного появления событий АВ и АВ, то 
направление сопряженности называется положительным (рис. 1.3.4, 
аи 6). Если, наоборот, вероятности совместного появления собы- 


тий АВ и АВ больше, чем вероятности появления событий АВ 


и АВ, то направление считают отрицательным *. Направленность 
сопряженности, как указывалось при определении зависимых 
событий, характеризует видо-родовые отношения (включение) 
событий. т. 
В качестве мер, количественно характеризующих тесноту 
сопряженности, используются четыре коэффициента. Два из них 
применимы только к’ альтернативному (четырехклеточному) рас- 
пределению, назовем их коэффициентами четырехклеточной сопря- 
женности. Два других применимы к любой т X п-клеточной 
системе событий, назовем их коэффициентами т Х п-клеточной 
сопряженности. Аоэффициенты, четырехклеточной сопряженности 
вычисляются по следующим формулам: | 


О, (1.3.26) 
и - (4.3.27) 


Vaai Otat) 


где значения а, b, с, 4 и их сумм понятны из таблицы 1.3.11. 
Коэффициент Ф известен под названием коэффициента ассоциа- 
ции (связи). Он оценивает сопряженность только в одном направ- 
лении, и вернее было бы назвать его коэффициентом односто- 
ронней сопряженности. Коэффициент О известен под названием 
коэффициента сопряженности (контингенции). Он оценивает вза- 
имную сопряженность, поэтому лучше называть его коэффициентом 
взаимной сопряженности. Оба коэффициента изменяются в пре- 
делах: 


* Такое определение направлений обусловлено, как показано ниже, 
знаком количественных мер сопряженности. 
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Таблица 1.8.11 
Четырехклеточное (альтернативное) распределение 


= Частоты 
События А А или частости 
событий В 
В а b a-b 
: B c d c+d 
Частоты или частости CO- a+c -= b+d a+b+c-+d 


бытий А 


Пример 1.3.9а. По данным эксперимента, рассмотренного в при- 
мере 1.3.2, определим тесноту и направление сопряженности 
между отклонением влево и вправо от вертикали и действиями 
левой или правой рукой. Согласно табл. 1.3.2 и 1.3.11: а = 12, 
b = 84, с = 91, d = 18. Вычислим по формулам (1.3.26) и (1.3.27): 


< 


Q= 12-18-84 216—164 _ TB _ (од 
— 12.18-91.84 21416+7644 7860 ^^” 

PED ОК < S 

V 96-109-102-103 10 500 м 


Сопоставив полученные значения О и Ф, можно видеть, что 
коэффициент Ф дает более осторожную оценку сопряженности, 
чем коэффициент О. 

Связь между значениями Q и Ф и совместным распределением 
вероятностей событий иллюстрирует табл. 1.3.12. Неодинаковая 
чувствительность О и Ф к форме совместного и безусловных 
_ распределений (табл. 1.3.12) позволяет рекомендовать к исполь- 
зованию коэффициент О тогда, когда частоты концентрируются 
преимущественно в трех клетках таблицы, а коэффициент Ф исполь- 
зовать во всех остальных случаях. 0 
Таблица 1.3.12 
К сопоставлению коэффициентов аесоциации и контингенции 


(с сокращениями заимствована из сб. Методика и техника 
статистической обработки первичной социологической информации. 
«Наука», М., 1968, стр. 238) 


а 6 в 
ие, Е НЙ, ССВ 
Вор Чо бов ay a a. E O S 
B 35:45 80 B 31 49 80 В 30:80 80 


7 (А)| 50 50 100: F (А) |550 30. 100. [А 50 50 100 


0=0,59; Ф=0,25 Q =0,94; Ф=0,45 ` Q =1,00;- © =0,50 
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Коэффициенты т Х п-клеточной сопряженности вычисляются 
по следующим формулам: 


C= E am Vre (1.3.28) 
Tie- pint 
| z 
уе при m n, 
N A OA T eE (1.3.29) 


Коэффициент С предложен К. Пирсоном и часто называется 
коэффициентом взаимной сопряженности Пирсона. Коэффициент 
К предложен А. А. Чупровым и часто называется коэффициентом 
взаимной сопряженности Чупрова. В оба коэффициента входит 
величина у?, имеющая в статистике большое значение. Мы будем 
рассматривать у? подробно в главе 5, а здесь познакомимся с ее 


вычислением: 
TA (fii — fii)? , zx (£330) 
Е СЫ 


где f; — наблюдаемая в опыте частота, fiy — теоретически OKH- 
даемая частота. 

Если вместо частот применять вероятности, то формула (1.3.30) 
перепишется следующим образом: 


(Pij — р)? 
R > a ; 
—п р Е (aS 


где n= È È fy — объем выборки. Рассмотрим вычисление %? и 


] L 

коэффициентов C и К на примере. 

Пример 1.3.96. По данным наблюдения определить, имеется ли 
у людей сопряженность между цветом волос и цветом глаз. 
В табл. 1.3.13 приведены частоты совместного распределения 
трех градаций цвета глаз и четырех градаций цвета волос, а также 
безусловные распределения. * В каждой клетке, соответству- 
ющей совместному появлению событий А,В;, записаны три числа: 
первое (сверху) — эмпирическая частота Fij, второе, (в середине) — 
ожидаемая частота fij, третье — разность: Па fi; (см. формулу 
1.3.30). 

Ожидаемая частота fij определяется из условия независи- 
мости событий (1.3.6), по которому частота совместного появления 


* По кн. В. Ю. Урбаха «Биометрические методы», стр. 357 («Наука», 
М., 1964). 
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Таблииа 1.3.18 
Данные к примеру 1.3.96 


Цвет волос 
F(A) 
Светлый Русый Черный Рыжий À 
Bı 2 Bs В 
ев 71 ее. 14 
> Ат 117 96 47 19 279 
Е 60 —25. | 80 —5 
fj 
laa] 
© 
z 
A E 95 119 S15 25 
5 >. А? 131 108 53 22 344 
a ES E —36 11 22 3 
e 
= 12 44 23 8 
a Аз 36 30 ‚15 6 87` 
g | —24 14 8 2 
| 
f (Bi) и | 3 115 | 47 680 


независимых событий равна произведению безусловных частот, 
деленному на общее число наблюдений: 


fa => f (A;)-f (B), (1.3.32) 


где n= > (А) =» (B) обе количество наблюдений; f (A;) 


j 
И f (B) — понятны из табл. 1.3.13. Используя значения разно- 
стей Mij — fà) в табл. 1.3.13, определим слагаемые в формуле 
для X’, а затем и %’: 


60? : 447 =30,8 22:53 =9,1 
36?:134 = 9,9 — 8?2:15—4,3 
242: 36=16,0  52:19=1,3 
252: 96= 6,5 3?:22=0,4 
142: 108 = 14 2: 6=0,7 
142: 30= 6,5 


30%: 47=19,2  %”= 105,8 ~ 106. 


_ По одной из формул (1.3.28) определим коэффициент взаимной 
_сопряженности Пирсона: С = 1/106 : (106 + 680) ~ 0,37. Коэф- 
фициент Чупрова дает несколько меньшую величину: А = 

= У 106 : : 680.1 2-2 ~ 0,25. Правила использования коэффи- 
циентов Си К сводятся, во-первых, к правилам применения %* 
(см. стр. 300) и, во-вторых, к следующему. Считается, что коэф-. 
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фициент Чупрова менее чувствителен к количеству событий 
_т X и, чем коэффициент Пирсона, поэтому при малых значениях 
т и п лучше применять коэффициент К (Чупрова). В заключение _ 
отметим, что оба коэффициента изменяются только от нуля до 
единицы и измеряют тесноту сопряженности, не указывая ее 
направления. О нем легко судить по форме совместного распре- 
деления вероятностей (частот) событий. 


1.3.4. Поеледовательность событий 


Пусть в каждом из п последовательных испытаний может 
появиться одно из $ несовместных событий А}, (i =1, 2, ..., S; 
Е =1, 2, ..., n), образующих полную группу. Пусть Р;, — это 
вероятность появления события А;,. Тогда в результате А испы-° 
таний реализуется некоторая последовательность событий: 


А; 1, A u Erer Aiki» Аз». (1.3.34) 


Если испытания независимые, то появление каждого 1{-того собы- 
тия не зависит от его места в последовательности и определяется 
только безусловной вероятностью Р;. В этом случае события 
независимы в последовательности, * и такую последовательность 
событий называют последовательностью Бернулли. 

Если испытания зависимые, то появление каждого 1-того 
события зависит от того, какие события появились до него, т. е. 
зависит от места в последовательности. В этом случае события 
являются зависимыми в последовательности. Такая последова- 
тельность называется цепью Маркова. Различают простые и слож- 
ные, однородные и неоднородные цепи Маркова. Если для каж- 
HOTO из событий условная вероятность появиться в k + 1-м испы- 
тании зависит от того, какое событие появилось в А-том испытании 
_и не зависит от информации о событиях, наступивших во всех 
предыдущих А — 1 испытаниях, то последовательность событий 
(1.3.34) называется простой цепью Маркова: события -B простой 
цепи Маркова зависят в последовательности только попарно. 
Если условная вероятность появиться в k + 1-м испытании зави- 
сит от того, какие события появились в двух или более предше- 
ствующих испытаниях, то последовательность событий (1.3.34). 
‚называется сложной цепью Маркова; в ней события зависят в по- 
следовательности по два, по три и вообще — по h, где 2 = й= п. 
Если в реализации последовательности величина h не изменяется, 
то цепь Маркова является однородной. Простая цепь по определе- 
нию всегда однородна. Если k He ponbnNo, то сложная цепь Map- 
кова является неоднородной. 

Обычно цепям Маркова дают следующую «физическую» интер-_ 
претацию. Некоторая система (биологическая, экономическая, 


* Отметим, что, будучи в указанном смысле независимыми в последова- 
тельности, несовместные события зависимы в совокупности (в полной группе). 
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социальная, психическая ит. п.) может находиться в $ состояниях: 
A, Ås, ..., А„, несовместных и образующих полную группу. 
B некоторые (случайные или определенные) моменты времени #, 
или при некоторых условиях g система переходит из состояния # 
_в состояние j (i = 1,2, ..., $$] = 1, 2, ..., S) © некоторой условной 
вероятностью P; = P (А/ПА», причем, как определено выше, 


при h = 1, последовательность состояний системы описывается 
простой (однородной) цепью Маркова, а при hk —= 2 — сложной, 
однородной или неоднородной. Количество зависимых в после- 
довательности событий h называют «памятью» системы. В: этой 
связи системы, для которых динамика состояний описывается 
простой цепью Маркова, обычно называют «системами без памяти». 
В случае описания системы сложной цепью Маркова говорят 
о системе с памятью; чем больше k, тем лучше память. Легко 
понять, что для многих объектов психологии человека и живот- 
‚ ных можно применять только сложные, в том числе неоднородные 
(из-за флуктуаций памяти) цепи Маркова. Но это не означает, что 
в психологии совсем лишено смысла применение сравнительно 
более разработанного аппарата простых цепей. Оно вполне оправ- 
дано для первоначальных моделей динамики состояний (и других 
событий) во всех отраслях психологической науки. 

Итак, под цепью Маркова будем понимать систему случайных 
событий А; (i = 1,2, ..., $) вместе с соответствующими им вероят- 
’ностями перейти из 1-того состояния в ]-тое; эти вероятности 
называются переходными вероятностями (Pi). Для каждого 
К-того Heperona («шага») совокупность вероятностей P;; образует 
матрицу * переходных вероятностей (матрицу перехода, пере- 


ходную матрицу): 


Ру -Pi _Рз 
r: -=|- Ва Pao Pap (1.3.35) 
Par: Poa -Pas 
В матрице (1.3.35) элементы P;;— это вероятности в Ё-том 


испытании появиться снова тому же событию, что M B k — 1-м 
испытании, т.е. система останется в предыдущем состоянии. 
Остальные элементы читаются, согласно обозначениям: первая 
цифра индексации (i) — это номер исходного состояния (события), 
вторая (]) — это номер состояния (события), в которое переходит 
система. Например, Pis — вероятность перейти из состояния: Í 
в состояние 2. Легко видеть, что по строкам матрицы (1.3.35) 
располагаются вероятности перейти на’ втором «шаге» из данного 
(1-того) состояния во все другие или остаться в прежнем состоя- 
нии: в первой строке — вероятности перейти из 1-го состояния 
в 1-е, 2-е и 3-е; во второй строке — перейти из 2-го состояния 
в 1-е, 2-е и 3-е ит. д. По столбцам обозначены состояния j, в KOTO- 


* Необходимые сведения о матрицах и действиях с ними даны в Прило- 
жении 1. 


рые. переходит система. Порядок переходной матрицы опреде- 
ляется количеством событий $, образующих полную группу. Одно. 
из них обязательно происходит при А-том испытании, так что 
в каждой строке должно выполняться равенство: 


о Простая цепь Маркова полностью определяетвея матрицей 
одного перехода. Если известна матрица переходов для системы 
событий в одном испытании, то можно определить вероятность 
того, что через А испытаний появится интересующее нас событие. 
Для этого используется следующая 
формула (равенство Маркова): 


P; (k) = È Ри (т)Р. (к —т), (1.3.36) 


0,5 


‘где k и т — натуральные числа: 
1= m< А; Pı (т) — вероятность 
перейти из Г-того состояния в [-ное 
состояние за M «шагов», Ру, (Е — т)— 
вероятность из |-НОГО состояния 
перейти в ]-тое за оставшиеся k — 
— т «шагов». 

’Поясним равенство (1.3.36), reo- 96 


метрически интерпретируя цепь 5 
Маркова в виде ориентированного FP". 1.3.5. Ориентированный 
граф, изображающий простую 
графа (рис. 1.3.5), вершины KOTO- цепь Маркова с тремя состоя- 
рого обозначают состояния (или ниями. 
события), а дуги (стрелки) — пе- 
реходы из состояния в состояние (или импликацию’” собы- 
тий). Каждая дуга такого графа реализуется на А-том шаге 
с вероятностью P;j, так что матрицу переходных вероятностей. 
и 39) можно рассматривать как матрицу смежности вершин 
графа *. Пусть заданы численные вероятности перехода в матрице 
(1.3.35), которые подписаны над дугами графа (рис. 1.3.5). Допу- 
стим, требуется определить вероятность перейти из первого 
в третье состояние за два шага, считая, что цепь простая. Полная 
группа возможных переходов следующая (см. рис. 1.3.5): 1) на 
первом шаге остаться в первом состоянии с вероятностью P; 
и на втором шаге перейти в третье состояние с вероятностью P33; 
2) на первом шаге перейти из первого во второе состояние с вероят- 
ностью P} на втором шаге перейти в третье состояние C вероят- 
ностью Р.з; 3) на первом же шаге перейти из первого в третье 
состояние с вероятностью P43 и остаться в нем на втором шаге 


Хх. 
04 


* яя А. Зыков. Теория конечных графов. «Наука», СО, Новосибирск, 
1969. 
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-C вероятностью Р33. Так как каждый из альтернативных перехо- 
дов — это произведение совместных зависимых событий, а их 
совокупность — сумма несовместных событий, то искомая вероят- 
ность определяется по формуле полной вероятности (1.3.16): 


о РЕ Pas + Раз. «Pog =0,5. 0,2-0,3. 0:3 = 
+ 0,2.0,4 =0,27. 


Аналогично рассуждая, по графу на рис. 1.3.5 можем определить 
вероятность за три шага перейти из первого состояния в третье: 


Раз (3) = Pir: Pir: Pis + Pio: Par: Pis + Раз: Por: Pis + Pu: Pie: Pos + 
+ Pio: Poot Pas + Pis: Paa: Pos T Ри: Pig: Pss + Pi: Роз: Pas ṣ 
-+ Риз: Рзз: Рзз = 0,5- 0,5-0,2 +0,3-0,1-0,2 +0,2- 0,2: 0,2 + 
+0,5- 0,3-0,3 +0,3-0,6-.0,3+0,2-0,4-0,3+0,5-0,2-0,4 + 
+0,3- 0,3-0,4 +0,2 -0,4-0,4 =, 295; 


На основе равенства (1.3.36) Марков доказал, что матрица 
переходов на А-том «шаге» (A) равна ^А-той степени матрицы 
переходов на первом «шаге»: 


т А, = (A1)? ее 


Этим уравнением и следует пользоваться для определения Py; (k). 

Пример 1.3.10 *. Совокупность рабочих семей разделена на три 
подгруппы: 1) семьи, не имеющие телевизора и не намеренные 
его купить; 2) семьи, не имеющие телевизора, но собирающиеся 
его купить; 3) семьи, имеющие телевизор. Статистическое обсле- 
дование позволило оценить вероятности перехода семьи из одной 
группы в другую на протяжении года и считать приемлемой модель 
простой марковской цепи. Пусть матрица переходных вероятно- 
стей оказалась следующей: 


0,8 0,4 01 
м 0 0,7 0,3 , 
G O LD 


где 1-я строка и 1-й столбец соответствуют первой подгруппе 

рабочих ‘семей, 2-е строка и столбец — второй подгруппе, а 3-и 
строка и столбец — третьей подгруппе. Определим, какова вероят- 
ность того, что в течение двух лет рабочие семьи приобретут теле- 
визор. Эта вероятность, очевидно, суммируется из вероятностей 
для рабочих семей из первой и второй подгрупп перейти в тече- 


* Заимствован в кн.:3. Павловский. Введение в математическую 
статистику. «Статистика», M., 1967, стр. 271. Числа в примере вымынгленные, 
но правдоподобные. 
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=- 


ние первого и второго года в третью подгруппу. Чтобы найти эти 

вероятности, воспользуемся уравнением (1.3.37) и определим 

матрицу: | | 
A =A 

00- Pt- U 98.0191 0,64 0,15 0,2 


=|0 0,7 0,3|.|0 0,7 0,3|=|0 — 0,49: 0,51 
9 о l во 


þa | ыы 


где искомая вероятность будет равна ‘сумме подчеркнутых услов- 
ных вероятностей в матрице A.: P = 0,24 + 0,51 = 0,72. 

Для сложных цепей Маркова равенства (1.3.36) и (1.3.37). 
не выполняются. Ноэтому сложная цепь Маркова в общем случае 
описывается вектором вероятностей начальных состояний и таким 
количеством матриц переходных вероятностей, сколько «шагов» 
системы рассматривается, — по одной на каждый «шаг». Обычно 
заранее не известно, простой или сложной цепью Маркова можно 
описать изучаемую систему. Чтобы выяснить это, необходимо 
экспериментально определить несколько матриц последователь- 
ных переходов, затем по уравнению (1.3.37) вычислить, пользуясь 
первой переходной матрицей, А-тую матрицу перехода и проверить, 
соответствует ли фактическая (экспериментальная) матрица А-того 
перехода, вычисленной на основе предположения о том, что цепь 
Маркова простая *. Если соответствия нет, то простая марковская 
цепь неприменима; если соответствие есть, то изучаемую систему 
можно описывать простой цепью Маркова. 

Пример 1.3.11. В экспериментах по обучению свободному 1 BOC- 
произведению слов установлено, что испытуемые` при первом 
прослушивании воспроизводят правильно из тридцати двух слов 9, 
при втором прослушивании 17, при третьем — 20, при четвер- 
том — 22 и при пятом — 26 слов. ** Требуется определить, зави- 
сит ли вероятность правильного воспроизведения (и, следова- 
тельно, запоминания) слов при А-том прослушивании только от их 
незапоминания при предыдущем прослушивании. Иначе говоря, 
требуется определить, можно ли процесс запоминания группы слов, 
предъявляемой человеку несколько раз со случайным порядком 
слов в каждом предъявлении, моделировать простой цепью Мар- 
кова. На основе приведенных данных определим матрицы переход- 
ных вероятностей, пользуясь следующей формой: 


_ [Рь(А) PA) 
И _0 1 , 


* Проверка соответствия осуществляется по критерию y? (см. стр. 301). 
** Использованы данные, приводимые Р. Бушем и Ф. Мостеллером. См. 


P. Буш, Ф. Мостеллер. Стохастические модели  обучаемости.. 
М., 1962, табл. 10.2, стр. 289, 
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где P, (А) — вероятность незапоминания слов и P, (А) — вероят-. | 
ность запоминания слов при К-том прослушивании. Обе вероят- 
ности расположены в первой строке, соответствующей исходному 
состоянию незапоминания. Вторая строка матрицы соответствует 
исходному состоянию запоминания, от которого можно перейти 
к состоянию незапоминания (забывание) или остаться в состоянии 
запоминания (сохранение). Так как в опытах по свободному 
воспроизведению слов нельзя объективно контролировать про- 
цессы забывания и сохранения запомненного материала, то пред- 
полагается, что забывание отсутствует и сохранение полное. По- 
этому вероятность забывания положена равной нулю, а вероят- 
ность ‘сохранения запомненного — равной единице. Вычислив 


вероятности P, (А) u P, (А), получаем o panig для пяти прослу- 


шиваний: 
0,72 с] 
1 |0 

0.47 oss 0,52 = 
Aan a ' 

_ [0,38 0,62 N, y 

ASi Па 1 

0,34 о - 52-073 

“4—0 | 

д [0.19 о д [019 0,84 

5 —|0 ей 0-21 


Предположив, что имеет место простая цепь Маркова, по уравне- 
нию (1.3.37) вычислим ожидаемые значения матриц Ах при k = 
= 2, 3, 4, 5, приняв в качестве исходной матрицу А|. Результаты, 
приведенные справа от матриц, определенных из опыта, наглядно 
свидетельствуют о возможности применить простую цепь Маркова 
в данном случае. 


$ 1.4 КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СИСТЕМЫ 
УПОРЯДОЧЕННЫХ СОБЫТИЙ 


1.4.1. Ранжирование событий по величине 


Если некоторое психическое явление обладает свойством, 
более или менее выраженным в конкретных условиях (например, 
у разных людей, в различных жизненных ситуациях и т. п.), то, 
а специальными экспериментальными приемами *, можно 


* Эти приемы, разработанные в психологии, рассматриваются в лите- 
ратуре. См., например, М. Решлен. Измерение в психологии. В сб. Ək- 
спериментальная психология. Под ред. П. Фресса и Ж. Пиаже. М., 1966. 
Б. Ф. Грин. Измерение установки. В сб. Математические методы в совре- 
менной буржуазной социологии. Под ред. Г. В. Осипова. М., 1966. 
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упорядочить проявления данного свойства по степени выражен- 
ности — NO величине. Тогда проявление некоторой величины 
интересующего нас свойства может рассматриваться как событие 
и притом — случайное событие. А множество таких событий, 
образующее полную группу относительно области проявления. 
рассматриваемого свойства (от минимума до максимума), состав- 
ляет систему упорядоченных событий. 

Система упорядоченных событий отличается от ‘рассмотренных 
B предыдущем изложении тем, что может быть геометрически M30- 
бражена на оси, как показано на рис. 1.4.1. Однако упорядочи- 
вание только на основе оценок «больше — меньше» не дает еще 
никакой числовой определенности. Числовая определенность о 


= y 
To T, Ta Ty Ti Th- Th 


Рис. 1.4.1. Система упорядоченных событий. 
Х — изучаемое свойство; Ly его проявление; 1=0,1,2,.. м 
п — 1, п, причем х.1 >X; При всех is 


достигается ранжированием, т.е. приписыванием баллов (или 
рангов) у; событиям 4,;. В качестве баллов используются 0 и числа 
натурального ряда 1, 2, 3 ит. д., причем не только положи- 
тельные, но и отрицательные. * При ранжировании заменяют 
неизвестные и обычно неравные интервалы между значениями 
упорядоченной переменной X равными интервалами À = Yi — И; 
между баллами У, как это показано на рис. 1.4.2. Очевидно, что 
такое «уравнивание» интервалов семантически фиктивно. Но фор- 
мально это допустимое приближение, так как математически 
ранжирование эквивалентно линеаризации: нелинейные прираще- 
ния Ах; переменной Х заменяются линейными приращениями 
Ау; переменной У. 

Часто упорядоченная переменная выражается через сумму 
баллов, «набираемых» испытуемым в результате выполнения группы 
заданий, посредством которых выявляется латентная переменная 
(см. $ 7.1). Причем, если каждое задание оценивается по двух-, 
трех-, HATH- и вообще А-бальной шкале, то сумма баллов У может 
принимать значения в пределах: } 


0=У=жйт, (1.4.1) 


где k — максимально возможное количество баллов в шкале; 
т — количество заданий в группе. В этой ситуации, типичной 
для большинства отраслей психологии, изучающих объекты более 
сложные, чем явления сенсомоторики, суммы баллов уже могут 
не образовывать равных интервалов в конкретном исходе опыта. 


* Строго говоря, ранги всегда положительны. Отрицательные ранги -- 
это центральные и результат центрирования ранжированной 
переменной (стр. 126). | 
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Torga формальное уравнивание интервалов достигается группи- 
ровкой исходных сумм баллов в классы длинной — где À обычно 
больше или равно 2. 

Выбор классового интервала À и определение границ перемен-. 
ной суммы баллов У состоит в следующем. Пусть уши — мини- 
‘мальное, а Ymax — максимальное значения У. Тогда 

= ant a (1.4.2) 

Ay 
где À — классовый интервал, ant — обозначение ближайшей целой 
части, Ду — натуральное число, причем необходимо, чтобы 
8 = Ау: обычно принимают: Ay = 8, 9, 10, 11, 12 — и более, 
если позволяет количество наблюдений. `Затем выбираются гра- 
ницы классов (и. Первая (нулевая) граница у, S уши, Для того 


Рис. 1.4.2. Ранжирование си-. 
т ке стемы упорядоченных событий. 


о Варя аЕ. X Х—изучаемое свойство, х,—его 


проявление; X; 1 >X; при всех $; 


i E ; р р х—х; 172,1; Но крайней me- 
; Г l l 1 Г / i для некоторых #1; У—баллы 
(ранги); y; (при i=0, 2: „6)— 
У ксякретные значения kiari YFA 

% у $ Yz Ya Ys $ — у; 1= УЕ У =А для всех i. 


чтобы Ymin He оказался за пределами классификации. Аналогично 
требуется, чтобы граница последнего класса Ypy = Ymax: Кон- 
кретные значения классовых границ, начиная со второй, опреде- 
ляются последовательно по формуле 


Уна = tÀ, (1.4.3) 


где i = 1, 2, ..., n + 1. В результате переменная сумма баллов У 
снова изображается в равных интервалах Л (но A-4 1) на чиело- 
вой оси, как это показано на рис. 1.4.2. 

Наряду с границами классов при группировке данных (стр. 106) 
используются средние значения классов. Эти значения — обозна- 
чим их W; — определяются, если выбраны границы классов * у,, 
по, уравнению 


ши 0,5. A, - (1.4.4) 
где #—1,2,..., ny1 для уи 1 =1, 2, ..., n для Wi. 


1.4.2. Распределение вероятностей ранжированной 
системы упорядоченных событий 


Каждому значению балла у; (или 1,) как случайному событию 
соответствует вероятность (частота, частость) его появления. 
Пусть на оси абсцисс отложены значения баллов Y; > Y; (для. 


* Bo многих случаях сначала выбирают wi, например тогда, когда «О» 
баллов желательно сделать началом отсчета. Тогда границы определяют, 
исходя из средних значений интервалов: у; =ш; —0 5A и у;41=\;- 0,5 А. 
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i— 1, 2, ..., п + 1), тогда каждому интервалу значений nepe- 
менной суммы баллов У соответствует вероятность Р (у; = У = 
< Yi); которая геометрически может быть представлена MJO- 
зцадью прямоугольника с основанием À и высотой } (У): 


P (nS Y < ин) =f (Y) A. (4.4.5) 


Рис. 1.4.3. Полигон (a) m 

кумулята (6), а также соот- 

ветствующие им гистограм- 

мы распределения вероят- 

ностей ранжированной си- 

стемы упорядоченных CO- 
бытий. 


По оси абсцисс—баллы У; по 
оси ординат— вероятности (так 
как ^=\1):  а— вероятность 
P (y;< У<у;. 1); б —вероятность 
Р (У<у УХ Пунктиром отмечены 
вероятности Р (и; <Уу<х Yi+1), 
соответствующие средним 3Ha- 
чениям интервалов (%;). Qi, 
Q2, Оз — первый, второй и тре- 
: тий квартили. 


Фигура, образованная такими прямоугольниками, расположен- 
ными вплотную друг к другу на плоскости, называется гисто- 
граммой распределения вероятностей (частостей, частот) ранжи- 
рованной системы упорядоченных событий. Гистограмма при 
À = 1 изображена на рис. 1.4.3. На основании выполнения Hepa- 
венства Y; > у; значения баллов у; при любых $ на оси абсцисс 
фиксированы не произвольно, как это имело место для системы 
‘классифицированных событий. Поэтому в отличие от диаграмм 
распределения, рассмотренных выше, гистограмма распределения 


5 Г. В. Суходольский | | ` 65 
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имеет конфигурацию, зависящую от ординат f (У) и классо- 
вого интервала À, но не допускающую перестановок «столбиков» 
на оси абсцисс. z i 

В отличие от системы классифицированных событий система 
упорядоченных событий характеризуется тем, что изучаемое 
свойство Х — это по существу непрерывная латентная переменная, 
которая лишь в силу обстоятельств представлена в виде ряда 
дискретных значений *. Поэтому следует ожидать, что и вероят- 
ности значений 1;, переменной X должны изменяться непрерывно, 
а не «скачками» как на гистограмме. В этой связи более удобной 
плоской фигурой для геометрического изображения вероятности 
появления баллов на интервале À является прямоугольная тра- 
пеция, равновеликая прямоугольнику гистограммы (см. рис. 1.4.3). 
Обозначив ординаты сторон такой трапеции как f (y) и f (Yna), 
где у; и Y1 — абсциссы интервала À, очевидно получим площадь 
трапеции, мы вероятность: 


P (yS Y < Ym) =0,5 [1 (и) + f (Yim) ] À, (1.4.6) 


где P (yis Y < Yi) — вероятность появления баллов на интер- 
вале 

Фигура, образованная трапециями по (1.4.6), расположенными 
вплотную друг к другу на плоскости У, f (У), называется nonu- 
гоном или многоугольником распределения (рис. 1.4.3, а). Поли- 
TOH распределения более точно выражает изменение вероятностей 
значений упорядоченной непрерывной переменной, чем гисто- 
грамма. Но в результате группировки экспериментальных данных 
обычно получают сначала гистограмму. Если известен полигон, 
то легко определить ординаты гистограммы по уравнению 


f (wi) = 0,5 [F (Y1) + f (Уна), (1.4.7) 
где f (1ш;) — ординаты средних значений интервалов, а f(y) и 
f (Y1) — ординаты границ классов, i = 1, 2, ..., n+ 1 для y; 
ПЕ г Пя: | | 


От гистограммы к полигону можно перейти двумя способами. 
Первый способ состоит в том; что средние значения интервалов 
отождествляют с новыми границами (W; == у;), сдвигая тем самым 
все основание ряда влево на 0,5/,. Это допустимо потому, что, 
в сущности, безразлично, принять ли #-тую точку на оси абсцисс 
за границу y; или за среднее значение W; {того интервала. Таким 
образом, соединяя все у; (i = 1, 2, ..., п — по числу ш,) отрез- 
ками прямых, образуют большую часть полигона, площадь кото- 
рого, однако, остается меньше единицы до тех пор, пока не будут. 
выбраны новые «левая» и «правая» границы (Y4 и У,. 1). Эти rpa- 


* Непрерывной называется переменная, принимающая на daioun 
малом интервале бесконечно большое число значений. Дискретная перемен; 
ная на конечном интервале имеет конечное число значений. 
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чицы определяются по уравнению (1. 4.3): Yı = Уз — Л и Уж 1 = 
= у, + ^. Ординаты f (ya) и (и. 1) этих границ чаще всего 
неизвестны. Но для большинства распределений, у которых 
вероятности границ равны нулю или асимптотически к нему стре- 
мятся, принимается } (у!) = f (у. 1) = 0. Второй способ nony- 
‚чения полигона из гистограммы основан на формуле (1.4.7), 
преобразуя которую, получаем уравнение 


1 (ивы) =f U+ 2f w) — f Ud, Е 


где обозначения те же, что ив (1.4.7), &=1,2, .... n + Ти Г (у!) 
—/(,.1) = Q. При этом границы у; отличаются от первоначаль- 
ных сдвигом влево’ на 0,5 Л (см. рис. 1.4.3, а). Если Л = 1, то 
ординаты f (у,) и f (w), как следует из (1.4.5) и (1.4.6), тожде- 
ственно равны соответствующим вероятностям P (у;) и P (w и. 
Так, например, ординатам полигона и гистограмм на рис. 1.4.3, 

соответствуют оценки вероятностей, приведенные в табл. 1. д. + 
Так как значения у; образуют полную группу событий, то сумма 
вероятностей для полигона и для гистограммы равна единице: 


УР = У = ум) =1. (1.4.9) 


Иначе говоря, площадь, занимаемая полигоном или гистограммой, 


приравнивается единице (см. табл. 1.4.1). 
‘Таблица 1.4.1 


Количественные данные к рис. 1.4.3, а 


Полигон Гистограмма 
Ji P (Yi) w 2. (1%) 
1 0,000 0,5 0,0125 
2 0,025 1,5 0,0375 
3 0,050 2,5 0,1500 
4 0,250 3,5 0,3000 
5 0,350 4,5 0,2750 
6. 0,200 5,9 0,1500 
$ 0,100 6,5 0,0625 
8 0,025 7,5 0,0125 
9 0,000 | ia я 
1,000 1,0000 


5 


Наряду с вероятностью появления значений на фиксированном 
интервале À имеет большое значение вероятность того, что paH- 
жированная переменная не превзойдет одного из возможных 
значений: 


=M 


Ру = SMa ADhe = у) -© (1.4.10) 


Ymin 
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при Уна < Y; < Ynn 0 = Р (У = у) = t. Сопоставляя уравне- 
ние (1.4.10) с уравнениями` (1.4.5) и м. 4.6), легко видеть, что 


P (Y <y) =A: D f (w) или Р(Учи—0,54) А.Х (и), (1441) 


где AT ioe а ординаты средних P интер- 


$ 


валов, а У f (y;) — «накопленные» ординаты границ интервалов. 


i 
Фигура, образованная прямоугольниками с основаниями À и 


высотами > f (w;) — это кумулятивная гистограмма; она изобра- 
1: 


L 
жена на рис. 1.4.3, 6. 
Фигура, образованная прямоугольными трапециями, опира- 
ющимися на интервалы À и имеющими в качестве оснований орди- 


наты > 7 (и) их Ри, называется кумулятивным полигоном 
Yi 


или кумулятой Toka 1.4.3, 6). Переход от ординат кумуляты 
к ординатам кумулятивной гистограммы достигается по уравнению 


2109 —0,5 | Хи 1) (1.4.12) _ 
ыы i 1+1 
и обратный переход (при f(y) =0) —по уравнению 
У (ив) = > (у) 12| 1 (w;) — > w). (1.4.13) 
Yi+i 
При À= f, как это а из (1.4.11), весе ре заменяются 
соответствующими вероятностями. В частности, для рис. 1.4.3, 6, 


они приведены в табл. 1.4.2. 
i Tabnuya 1.4.2 


Количественные данные к рисунку 1.4.3, 6 


Кумулята Кумулятивная гистограмма 
Yi p (И;) Wi p (wi) 
4 0,000 0,5 0,0000 
2 0,025 1,5 0,0125. 
3 0,075 LAS 0,2000 
4 0,325 3,5 0,5000 
5 ERY 4,5 0,7750 
6 0 875 55 0,9250 
та 0,975 6,5 0,9875 
в 1,000 7,5 1,0000 


Итак, распределение вероятностей ранжированной системы 
упорядоченных событий может быть задано таблично и графически 
в двух основных формах: в виде полигона и в виде кумуляты, а 
также путем соответствующих гистограмм. Получение этих форм 
‚ по эмпирическим данным ниже будет рассмотрено на примере. 
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Независимо от способа и ‘формы задания, распределения Bepo- 
ятностей баллов У упорядоченных переменных . ‚Х различаются, 
во-первых, положением на числовой оси (рис. 1.4.4, а), во-вторых, 
рассеиванием значений переменной (рис. 1.4.4, 6) и, в-третьих, 
асимметрией (косостью, скошенностью) рассеивания значений 
переменной (рис. 1.4.4, в). Эти три свойства как по отдельности, 


а 


Рис. 1.4.4. Свойства законов распределения ранжире- 
ванной переменной. 


а — положение; б — рассеивание; в — асимметрия. По оси аб- 
cunce — баллы, по оси ординат — вероятности. 


так и в сочетаниях, обусловлены по степени выраженности CNE- 
_цификой упорядоченной переменной X, а также условиями, 
в которых она эмпирически изучалась. Поэтому количественно. 
характеризуя степень проявления каждого из трех указанных 
свойств и пользуясь их количественными характеристиками, пси- 
холог получает возможность сравнивать психические явления 
y разных людей и в различных условиях. Иначе говоря, так как 
распределения вероятностей характеризуют конкретные упоря- 
доченные психические переменные, то, сравнивая распределения, 
опосредованно сравнивают психические переменные. s 
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1.4.3. Количественные характеристики распределения 
вероятностей системы упорядоченных событий — 


Количественные (числовые) характеристики свойств распре- 
деления вероятностей ранжированной переменной определяются 
Ha основе квантилей. Авантилем называется значение переменной, 
отделяющее от распределения «слева» или «справа» определенную 
долю объема совокупности. Если объем совокупности (площадь 
гистограммы, полигона или кумуляты) положен равным единице, 
то квантиль — это значение у; переменной У, для которого 
задана вероятность 


P(Y = y;) либо P(Y =y) =1-Р(уэу,) (1.4.14) 


Среди квантилей, имеющих огромное значение в математической 
статистике, обычно используются квартили, децили и центили. 
Квартили делят совокупность на четыре части, поэтому их всего 
‘три. Децили делят совокупность на десять частей, их девять. 
Центили отделяют от совокупности по. 0,01 части; их 99. 

Для распределений упорядоченной переменной используются 
преимущественно квартили. Именно через квартили определяются 
в этом случае числовые характеристики положения рассеивания 
и асимметрии. Первый квартиль О, отделяет слева 0,25, объема 
совокупности. Второй квартиль О. делит совокупность на две 
равных по объему части (по 0,5); этот квартиль называется медиа- 
ной. Наконец, третий квартиль Оз отделяет слева 0,75 объема 
совокупности и справа. 0,25 объема (см. рис. 1.4.53, 6). 

Вычисляются квартили по полигону или кумуляте, заданным 
графически или таблично. Если переменная Х ранжирована по 
возрастанию (5;.: > х,, соответственно: Y; 1 >> И,), то вычиеле- 
ния проводятся «слева — направо» по следующим формулам: 


n ) 
Q= A QD HA (Sa) оз. 


Qa =A (AHA E Sa) a (1.4.15) 
Q: =A IHAT- Sa) r 


где Q; — i-THË квартиль, А (Q;) — начало классового интервала, 
в котором находится {-тый квартиль; А — классовый интервал; 
п — объем совокупности в частотах, п = 1, если используются 
частости или вероятности; о д — сумма частот (частостей, вероят- 
ностей) классов, предшествующих тому, где находится 1-тый квар- 
тиль (S4 =Р[У < A (0,)]); f (Q) — частота (частость, вероят- 
ность), ‘соответствующая классу, где находится {-тый квартиль. 
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yi у n F s : А 


Если переменная Х ранжирована по убыванию (ож 
но Y1 > Yi), то вычисления проводятся «справа — налево» по 
формулам: 


0,=8@)-* (2—8) а, | 
0,=В (0)—^(->—5в) о), (1.4.16) 
Qs=B (Q3) —^ ($ — Se) оз 


где B (Q) — «komen» класса, где находится Г-тый квартиль; 
Śp — суммы частот (частостей, вероятностей) классов, следующих 
за классом, где находится 1-тый квартиль; остальные обозначения 
те же, что и в формулах (1.4.15). * 

Мерой положения распределения вероятностей ранжированной 
переменной является медиана (Ме = Qə). Для симметричных 
распределений медиана совпадает с модой, для асимметричных — 
не совпадает. Медиану рассматривают как центр рассеивания 
значений ранжированной переменной. 

Приближенной мерой рассеивания является размах распре- 
деления. Эта область существования (или экспериментального 
определения) ранжированной переменной. Очевидно, чем больше. 
размах, тем больше и рассеивание значений относительно медианы. 
Однако при одном и том же размахе рассеивание значений может 
быть более или менее «кучным». «Чувствительной» мерой рассеи- 
вания является полуинтерквартильное (вероятное, срединное) 
отклонение. Оно определяется как половина интервала рассеи- 
вания, включающего медиану, которому соответствует половина 
объема совокупности, т. е. 


Е 0,50, O, (1.4.17) 


где E — полуинтерквартильное отклонение; Q; и О, — третий 
и первый квартили. Для симметричных распределений (рис. 1. AAi 
и 6) | 


Е = Më О, = ОМ > (1.4.18) 
но для асимметричных распределений (рис. 1.4.4, в): 
Me — 0, 52 0; — Me. = (4.4.49) 


На этом и основана количественная оценка асимметрии распре- 
деления. 

Мерой асимметрии является квартильный коэффициент асим- 
метрии, который определяется по формуле 


‚Аз (0) = я (01-Е 0з — 2Me), (1.4.20) 


| * Отметим, что формулы (1.4.16) можно использовать для проверки 
’вычислений по (1.4.15). 
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где As (Q) — ква ртильный коэффициент асимметрии; 
_— {< Аз (0)<1. 


Из уравнения (1.4.20) нетрудно установить, что для симметрич- 
ных распределений Аз (0) =0, при скошенности влево (Í на 
рис. 1.4.4, в) Аз (0) > 0, а при скошенности вправо (2 на рис. 
1.4.4, в), наоборот, Аз (Q) <0. Поэтому. скошенность (асимметрию) 
влево называют положительной, а скошенность вправо — отри- 
цательной. 

Пример 1.4.1. По одному из субтестов батареи Векслера 
(отечественный вариант) на выборке в 100 испытуемых получены 
суммы баллов, приведенные в табл. 1.4.3. Осуществим группи- 
ровку данных, определим полигон и кумуляту распределения 
(в частостях) и его числовые характеристики. 


Таблица 1.4.8 


Суммы баллов к примеру 1.4.1 


T: 


: l 
1 2 3 | 4 229 3 4 5 
15 20 14 13 10 9 24 17 14 16 
12 15 16 5 15 15 7 9 25 23 
20 16 14 17 21 15 10 19 2 25 
18 16 10 20 24 11 15 15 17 15 
10 11 22 22 22 19 17 20 14 11 
14 12 24 16 9 23 13 11 18 17 
18 23 22 19 23 26 19 14 22 19 
17 21 21 18 16 20 21 15 23 16 
15 24 18 14 18 12 20 16 15 20 
22 23 16 15 14 5 20 22 20 22 


| fi 


Сначала определим классовый интервал по уравнению (1.4.2), 
пользуясь данными табл. 1.4.3: 


Ymin=5; Ymax =26; А =at | 2. 

Найдем значения границ интервалов для группировки данных. 
Учитывая, что среди эмпирических значений отсутствуют. значе- 
ния Ô и 5, но имеются значения 5 и 7, выберем средние значения 
интервалов: Wi =5; Wa =T и так далее по формуле (1.4.4). 
Тогда границы интервалов для группировки определятся по 
уравнению (1.4.3): у, = 4, Y= Ô и так далее, как указано 
в табл. 1.4.4. Существуют разные способы группировки данных 
(см. стр. 106). Здесь осуществим группировку так, как показано, 
в табл. 1.4.4. Каждое значение У, удовлетворяющее условию: 


Yre У = Унь 
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Таблица 1.4.4 


_ Группировка первичных данных из таблицы 1.4.3 


и Кодирование ` |  “Ч®0тЫ оначений 
4+6 — II | 2 
ЕЕ. I : 1 
8 = 10 ии 11 8 
10 12 РАНЕ 8 
1214 ин HII 9 
14+ 16 AA RA пи пп пит | 21 
16 + 18 пи HI 1 12 
18 + 20 III пи IN i 13 
20 -= 22 | пи ии п! 13 
22 -+ 24 HE e | 10 
24 -= 26 И 3 
Сумма частот | N = 100 


Примечание. Вместо пятиричной системы кодирования иногда 
используют десятичную, которая, однако, приводит к большему числу 
ошибок в группировке и поэтому не может быть рекомендована. 


где у; и И,.!— соседние границы, кодируется «палочкой» в соот- 
ветствующей строке таблицы. Окончив кодирование всех экспери- 
ментальных данных, подсчитывают частоту и сумму частот № 
(табл. 1.4.4). Далее необходимо вычислить частости P (у; < У = 
< И,. 1), а затем по формуле (1.4.10) — накопленные частости 
P (У = y;) и сопоставить эти частостя средним значениям интер-` 
валов Wj. Это выполнено в табл. 1.4.5. 

Получим полигон распределения по первому способу. Для 
этого, считая W, новыми границами интервалов. выберем первую 
и последнюю границы полигона: Wy = Wy — лиш = Ш, + À, 
соответственно W4 = 3 и Wp, = 27. Принимая } (3) = f (27) = 
= 0, построим полигон и кумуляту на графике, как показано 
на рис. 1.4.5. Пользуясь табл. 1.4.5 и формулами (1.4.15), вы- 
числим значения квартилей: О, = 11 + 2 (0,25 — 0,19) : 0,09 ~ 
вы 9 Os == о 012 15.2; Ọ; = 19 + 
+ 2(0,75 — 0,74) : 0,13 == 19,2 
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Таблица 1.4.5 


Частости полигона и кумуляты к примеру 1.4.1. 


У; 

WwW, = И, Полигон Кумулята 
; ii l 1 
f SEE FETIDE. при построении P (Yi < Y < 11.1) р (У <4) 


ровке 


1 ES E n Sa 
a 3 0,00 0,00 
2 4 
ЕЕ 5 0,02 0,02 
3 6 
S 7 0,01 0,03 
4 8 ет 
гы 9 0,08 0,11 
5 10 
УВЕ 11 0,08 0,19 
6 12 
а. 13 0,09 0,28 
7 14 
— i 15 0,21 0,49 
8 16 
—— 17 0,12 0,61 
9 18 
т 19 0,13 0,74 
10 20 
— 21 0.13 0,87 
11 22 
—— 23 0,10 0,97 
12 24 
A l 25 0,03 1,00 
13 26 —— 
ты 27 0,00 > 


», 1,00 a- 


t | 


Проверка по формулам (1.4.16) показывает, что значения квар- 
тилей вычислены правильно: Q, = 13 — 2 (0,75 — 0,72) : 0,09 ~ 
> 42,3; О. = 17 — 2(0,50 — 0,39) : 0,12 2= 15,2; Q= 21 — 
— 2 (0,25 — 0,13) : 0,13 ~ 19,2. 

Далее по формулам (1.4.17) и (1.4.20) вычислим полуинтер- 
квартильное отклонение и квартильный коэффициент асимметрии: 
Е = 0,5 (19,2 — 12,3) ~ 3,45. As (0) = (19,2 + 12,3 — 2.15,2): 
:2.3,49.-= 0,17. Последняя `числовая характеристика показы- 
вает, что распределение баллов достаточно близко к симметрич- 
ному. | 
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Рис. 1.4.5. .Полигон (а) и кумулята (6) частостей сумм 
баллов к примеру 1.4.1 — 


По’'оси абсцисс — границы классов группировки в баллах. По оси 
ординат — частости. 


‚1.4.4. Меры корреляции рангов 


_ Две (или более) системы упорядоченных событий могут быть 
стохастически взаимосвязаны, подобно тому как это имеет место 
для системы классифицированных событий. Стохастическая связь 
в этом случае известна под названием ранговой корреляции. Она 
характеризуется степенью (теснотой) и направлением, которые 
оцениваются для несгруппированных значений ранжирован- 
ных переменных. Пусть совместно наблюдаются упорядоченные 
переменные Х, и Х., каждая из которых независимо ранжи- 
руется *, соответственно получают два ряда значений баллов У, 
и У.. Если для каждой той пары значений ранги (баллы) пол“ 
ностью совпадают, то имеет место максимально тесная положи- 
тельная связь. Если, минимальные ранги одной переменной соот- 
ветствуют максимальным рангам другой (или наоборот), то имеет 
место максимально тесная отрицательная связь. В общем случае 


* Ранжирование выполняется независимо, но «в одном направлении» 
(по убыванию или по возрастанию) для обеих переменных. Правила ранжи- 
рования те же, что и при ранжировании по вероятности (стр. 49). 


х 


для п пар ранги у каждой 1-той пары могут отличаться на вели- 
чину от 0 до n — 1, при i = 1, 2, 3, ..., п. Для количественного 
выражения тесноты и направления связи ранжированных пере- 
менных У, и У, используются коэффициенты ранговой корреля- 
ции по Спирмену и по Кендалу. 

Коэффициент корреляции рангов по Спирмену определяется 
следующим образом. Если среди рангов каждой из переменных 
нет одинаковых (усредненных для «одинаковых» значений упоря- 
доченной переменной X), то используется формула: 


6 >14 
i 


о (1.4.21) 


где р — ранговый коэффициент корреляции Спирмена; 4, = у}? — 


— yi? — разность {-тых рангов переменной У, и переменной У’; 
п — количество сопоставляемых пар: #=1, 2, 3, ..., п. 

Если среди рангов каждой (или одной) из. переменных: имеются 
одинаковые, причем, возможно, несколько групп одинаковых 
рангов, то используется формула: 


6 (> Э+Ту, Ту, ) 


ее: т (1.4.24a) 
3 1 3 ; Я > 3 e 
где fy, =-5 У, (tf, —ty,) и ТУ, = (У... 
s42 t 
Í f 
1, — количество усредненных, одинаковых рангов переменной 


Y, n ty, — количество таких рангов переменной У, — в ]-той 
группе одинаковых рангов; ] — номер группы одинаковых рангов 
(см. пример 1.4.2). Наличие одинаковых рангов означает меньшую 
степень дифференцировки свойств упорядоченных переменных, 
представляемых баллами У; и Y >, следовательно, меньше и воз- 
можности оценить степень связи между ними. Для учета этого. 
уменьшения в формулу (1.4.24а) введены поправки Гу, и Ту,, 
в результате чего Q, вычисленный по (1.4.21а) при Гу, >0 n Ty, > 
> 0 всегда меньше, чем вычисленный по (1.4.21). 

Пример 1.4.2. * По данным анкетного обследования получены 
два ряда групи работников, упорядоченных: в соответствии 
с интересом к выполняемой работе (Yı) и по соответствию образо- 
вания и работы (У.). Определим, есть ли корреляция между 
этими переменными. Процесс вычисления р по уравнению (1.4.21). 
ясен из табл. 1.4.6: 


В: 


* Заимствован из кн. Методика и техника статистической обработки 
первичной социологической информации. «Наука», M., 1968, стр. 169, табл 462. 
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Таблица 1.4.6. 
‚Расчет коэффициента ранговой корреляции по Спирмену 


: Ранги у и: 
s а - | У: i ы 
SA 3 1 2 4.00 
2 a 5,5 — 2,5 6,25 
3 wesa 9 —6 
4 3 10 —7 49 
5 3 t45 — 8,9 72.25 
6 6,5 о 3 3,5 12,25 
7 6.5 J17 8 —1,5 2,25 
8 8 4 4 16 
9 9 у 7 49 
= 10 10 7 3 9 
ti 11 55 FO 30,25 
12 12 11,5 0,5 0,25 
13 13 13 0 0 
14 14 14 0 0 
Суммы 0 286,50 


Однако у обеих переменных имеются группы одинаковых рангов 
{по две группы), поэтому целесообразно воспользоваться оценкой 
тесноты связи по E (1.4.24а): 


Гу, = ча (58 — 5) + (2°— 2)] =10,5; 


Ty, =- (2—2) +(2— 2)]= 1; 


6 (286,5- 10,5 +1) 
14 (142 —1) 


Коэффициент корреляции рангов по Кендалу имеет несколько 
способов вычисления *. Наиболее простой: из них состоит в сле- 
дующем. Одна из переменных ранжируется и записывается так, 
чтобы ранги возрастали. Другая переменная ранжируется в том 
же «направлении», после чего ее ранги, соответствующие рангам 
первой переменной, записываются рядом (см. `табл. 1.4.8). Тогда 
коэффициент корреляции рангов Кендала определяется по формуле 


2 2 
t= v 1, (1.4.22) 


о=1— — 0,345. 


0.5 РР 


Еж. 92 Юа М. Дж. Кендэл. Теория статистики. Госстат- 
издат, M., 1960 - 


~J 
— 


где т — коэффициент корреляции рангов Кендала; Z; — KONM- 
чество рангов второй переменной, начиная с i -+ 1, величина 
которых больше, чем величина {того ранга этой переменной; 
i — номер (ранг) первой переменной, i = 1, 2, ..., п. Оба коэффи- 
‘циента ранговой корреляции изменяются в пределах: —1 = p< 1 
и —1 < T< 1, по модулю характеризуя тесноту связи, а по 
знаку — ее направление. Кендал считает, что у т имеется ряд 
преимуществ перед о. Однако это сомнительно, хотя бы потому, 
что в т не предусмотрена поправка на усредненные ранги и при- 
менять его в этом случае затруднительно. Иногда используют 
приближенное соотношение между этими коэффициентами: T ~ 
— 2/3 0, но следует помнить, что оно справедливо лишь для боль- 
ших N, а также не очень малых и не очень больших значений о. 
Очевидно, что эти ограничения слишком неопределенны. 
Пример 1.4.3. В результате анкетного обследования для девят- 
надцати важнейших видов оборудования, используемого судо- 
водителями во время вахты, получены два ряда ранговых оценок: 
«по важности» оборудования (Y4) и «по частоте» его использова- 
ния (У.). Есть основания предполагать, что эти ряды взаимо- 
связаны. Для проверки тесноты и направления связи вычислим 


Таблица 1.4.7 


_ Расчет коэффициента ранговой корреляции по Спирмену 
(к примеру 1.4.3.) 


i Код обору- | Рам o a T d? 
дования важность частота ’ 
1 А 1 1 0 0 
2 Б 2 4 —2 4 
3 В 3 2 1 1 
4 Е 4 6 g 4 
5 Д г 3 EP 4 
6 E 6 5 1 1 
7 IK к 12 —5 25 
e8 3 8 9 —1 1 
9 И 9 15 —6 36 
40 К 10 7 3 "Q 
11 JEA 114 11 0 0 
42 М 12 8 4 16 
13 H 13 10 3 9 
14 O 14 i 14 0 0 
15 п 15 17. А. 4 
16 P 16 13 3 9 
17 C 47 16 1 1 
18 T 18 18 0 0 
О У 19 19 0 0 
Суммы сы Er | 124 


> 


_ коэффициенты ранговой корреляции по Спирмену и Кендалу. 
По Е (1. 3.21) определим (табл. 1. AF: 


6. ее 

Данные для вычисления т представлены в табл. 1.4.8. Вели- 
чина Z, (последний столбец) получается следующим образом. 
Для 1-того ранга второй переменной (частота, в табл. 1.4.8) из 
оставшихся N — i рангов подсчитываются те, которые больше 
{-того по величине. Например, при i = 2, величина ранга частоты 
4. Просматривая оставшиеся 17 значений рангов частоты, видим, 
что 15 из них больше четырех, следовательно Z> = 15. Опреде- 
лив все Z;, суммируем их и вычисляем по (1.4.22): 


2.149 
= 05.409 170,74. 


Сравнивая т и 0, можно видеть, что, действительно, т < 0, но 
при этом т == 0,83 о > 2/3 о. 
Таблица 1.4.8 


Расчет коэффициента ранговой корреляции Кендала 
(к примеру 1.4.3.) 


Код обору- Ранги г 
пования (1) важность | частота t 
А 1 1 18 
B 2 4 15 
B 3 2 16. 
Г 4 6. 13 
Д 5 3 14 
Е 6 5 13 
IK 7 12 7 
83 8 9 9 
И 9 15 4 
К 10 у. 9 
Л 11 14 6 
М. 12 8 у 
Н 13 10 6 
О 14 14 4 
II 15 17 2 
P 16 13 3 
G 17 16 2 
T 18 18 | 1 
y 19 19 | 0 
Сумма | 149 ` 


Наряду с корреляцией рангов двух упорядоченных и ранжи-_ 
рованных переменных может рассматриваться корреляция рангов 
нескольких таких переменных. В общем случае N упорядоченных 


У 


и ранжированных переменных Y4, Yo, .. ‚ Ум, рассматриваемых 
совместно, образуют Л-мерную систему случайных. ранжирован- 
ных величин. Если в такой системе значения каждой величины — 
‘это простые ранги, то можно рассматривать, во-впервых, корре- 
ляцию рангов между всеми парами переменных, а во-вторых, 
согласованность рангов всех переменных, вместе взятых. Парные 
корреляции ее в М-мерной системе упорядоченных величин 
числом М (N —1) образуют матрицу коэффициентов ранговой 
корреляции (по Спирмену): 


E Pu Вуз. Pern. 

012 т. 023 жа Рам | 

013 023 1 а Osy , (1.4.23} 
Pin CoN Ом. а 1 x 


где из-за симметричности корреляций ij == ji, и максимальная. 
корреляция каждой переменной с самой собой равна единице 
(по главной диагонали). Вместо р в матрице (1.4.23) могут ис- 
пользоваться коэффициенты т КВендала. 

Для оценки степени совместной корреляции в такой системе 
используются коэффициенты согласованности. Один из них 
представляет собой модификацию коэффициента ранговой корре- 
ляции Спирмена: 


Е | лы 


(М1) (п  М(М—-т.(2-—9 


rata 2N (2n +1) 


где р — коэффициент согласованности по Спирмену; NV — число 
совместно рассматриваемых ранжированных переменных; j — 
номер переменной; j = 1, 2, ..., М; п = Ymax — Число ранжиро- 
ванных значений, одинаковое для всех переменных, и равное 
максимальному рангу: 1 = и; S n — #тый ранг ]-той упорядо- 
ченной переменной; все обозначения поясняются табл. 1.4.9. 

Другой коэффициент согласованности (конкордации) предло- 
жен Нендалом и Бэбингтоном Смитом: 


| 12 У, 5? ее 
E j=1 : =) 
W МЕ (8—1, (1.4.25} 
где 5 = S Yi; —0,5N (n+ 1), а остальные обозначения те же, что 
ив Eapro (1.4.24). 
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Заметим, что изменяются коэффициенты согласованности в сле- 


дующих пределах: —1 <р <= 1 и 0 < И = 1. Между обоими 
‚коэффициентами существует однозначная зависимость 


> ее: = W — 
= lp (N—1)+1] и lp = (1.4.26) 
_ Пример 1.4.4. B табл. 1.4.9 представлены ранги, полученные 
_ от трех экспертов, по отношению к одной и той же. упорядочен-_ 
ной переменной. Спрашивается, в какой мере оценки экспертов 

согласованы? 
Таблица 1.4.9 


К вычислению коэффициентов согласованности 


Эксперты (7) N : N 2 
A > Yj (2 v) S S? 
1 2 | 3 j=1 j=1 

T1 1 3 4 8 - 64 — 2,5 6,25 
T2 2 2 6 10 100 —0,5 0,25 
T3 S 1 1 5 25 —5,5 30,25 
T4 4 4 р 10 100 —0,5 0,25: 
т 5 a 3 13 ‚ 169 2,5 6,25 
Te 6 6 5 17 289 6,5 42,25 
EFUN a an a aa T141 | 0,0 | 85,5 


Вычислим р по формуле (1.4.24): 


Г ОЕ — Е | 
pte ЕЕ e poa ym, 


Вычислим W по формуле (1.4.25): 


12.855  _ 
EKOA ^^ 2“. 


Проверим по формулам (1.4.26): 


W = 


И (0,34: (3 — 1) + 1] = 0,54. 


Если-по уравнению (1.4.21) вычислить коэффициенты ранго- 
вой корреляции по Спирмену между результатами, полученными 
каждым из экспертов,’ то найдем значения Q12 = 0,77; P13 = 
= —0,09 и p33 = 0,26, которые можно записать в виде корреля- 
ционной матрицы, вида (1.4.23). Заметим, что коэффициент согла- 
сия между ними есть среднее арифметическое (см. главу 2): 


P=- (P12 + Pis + P23) = (0,77 — 0,09 + 0,26) : 3 ~ 0,34. 


6 г. В. Суходольский | 81 


Глава 2 


_ КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ 
СЛУЧАЙНОЙ ВЕЛИЧИНЫ 


$ 2.1. СЛУЧАЙНАЯ ВЕЛИЧИНА И ЗАКОН ЕЕ РАСПРЕДЕЛЕНИЯ 


2.1.1. Случайная величина 


Под величиной условимся понимать какое-либо физическое 
или психическое явление, которое относительно совокупности 
существенных условий характеризуется совокупностью чисел. 

Если изменяющимся условиям соответствует совокупность 
одинаковых чисел, величину называют константой. Ебли же 
изменяющимся условиям соответствует совокупность чисел, из- 
меняющихся по некоторому правилу, то величину называют. 
переменной. 

Если при одних и тех же (фиксированных) условиях вели- 
чина — безразлично, константа или переменная — принимает 
одно и только одно числовое значение, будем называть ее He- 
‚ случайной. 

Если при фиксированных условиях величина принимает раз- 
личные числовые значения, заранее неизвестно какие, назовем 
такую величину случайной. Иначе говоря, под случайной величиной 
(переменной) будем понимать такую переменную величину, кото- 
рая в конкретном исходе опыта случайным образом принимает 
числовое значение из множества таких значений, возможных при 
фиксированном комплексе условий опыта. 

Случайные величины, так же как и неслучайные, могут 
быть дискретными (прерывными) или непрерывными. Это обстоя- 
тельство существенно для определения количественных характери- 
стик, поэтому сначала рассмотрим специфику дискретной и непре-_ 
рывной случайных величин. 

Дискретная. случайная величина принимает всегда конечное’ 
множество целочисленных значений на заданном интервале возмож- 
ных значений. Это, например, такие случайные величины, как 
«количество случаев», «количество людей», «количество единиц 
продукции определенного рода» и т. п. 

Непрерывная случайная величина принимает теоретически бес- 
конечное множество значений на любом, сколь угодно малом ин- 
тервале возможных значений. Это, например, такие случайные 
величины, как «время реакции», «объем памяти» (в битах), «ум- 
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ственная одаренность» и T. п. Непрерывная случайная величина. 
при практическом использовании всегда квантуется, т.е. при- 
ближенно выражается в виде квантованной случайной величины. 

ЕКвантованная случайная величина определяется уже не бесконеч- 
ным числом значений, а конечным числом обычно равных интер- 
валов Àj,” «внутри» которых переменная остается непрерывной. 
В этой связи, с одной стороны, квантованная случайная величина 
похожа на дискретную, но с другой — все-таки остается прин- 
ципиально отличной от нее. 

Сходство в том, что дискретная случайная величина Хь за- 
дается конечной совокупностью возможных числовых значений 


Li, 2.... Zj, ... Zp и квантованная случайная величина Х, 
задается конечной совокупностью возможных числовых интерва- 
лов Л, А... №... м. Принципиальное различие между 


этими величинами состоит в следующем. Значения T; дискретной 
случайной величины — обязательно неотрицательные целые числа, 
так как они обозначают явления, для которых понятие «часть» 
(«доля») не имеет реального смысла (например, выражения «пол- 
случая» или «20,62 человека» бессмысленны). Между парами зна- 
чений дискретной случайной переменной существуют разрывы, 
поэтому не имеют смысла и разности Tiy — Tj, и любые части TA- 


G 9 
ких разностей — -(1,.1—;), где а > 1. 


Наоборот, интервалы À; квантованной непрерывной случай- 
ной величины, адекватно отображая реальность, непосредственно 
«переходят» друг в друга, так что конец интервала Àp есть в тоже 
время начало следующего интервала Aj; — непрерывность CO- 
храняется. Благодаря этому имеют реальный смысл не только 
любые разности À; = Ziy — Ti, но и любые сколь угодно малые 


доли этих разностей — Л; (где 1 < а<оо). Это в свою очередь, 


позволяет теоретически сколь угодно точно интерполировать зна- 
чения непрерывной случайной величины на основе изучения этой 
величины в квантованной форме. Но принципиально неверно по- 
ступать также с дискретной переменной. 


2.1.2. Закон распределения вероятностей 
значений случайной величины 


Рассмотрим сначала закон распределения вероятностей значе- 
ний дискретной случайной переменной. Тот факт, что дискретная 
случайная величина принимает определенное числовое значение, 
можно рассматривать как случайное событие и охарактеризовать 
возможность его появления вероятностью (частотой и частостью). 


* В частности, при любом измерении результат определяется лишь 
с точностью до абсолютной ошибки измерения Åz, т. €. если результат изме- 
рений z; определен как х; + Дх, то интервал квантования À = 2Ах. 
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_ Тогда дискретную случайную величину X можно определить как. 
систему из N чисел Li, 2.,... Lj, ..., Lpy которые появляются 
©- вероятностями` F (21), Р.(х.),..., Р; (1,),..., Р, (2). 
Совокупность вероятностей P, (х,;), сопоставленных значе- 
ниями 42; (i = 1, 2, ., п) дискретной случайной величины Х, 
образует ряд распределения ао значений случайной 
величины. 
SEAR распределения — это закон, связывающий отдельные зна- 
чения дискретной случайной величины с вероятностями их по- 
явления. 
Ряд распределения может быть представлен в табличной форме _ 
(табл. 2.1.1) и в виде «палочковой» диаграммы, как показано 


Ha puc. 2.1.1, а *. 
Таблица 2.1.1 


Ряды распределения вероятностей значений 
_ дискретной случайной величины 


Значения Х P; (хр i Р; (X<x;) | Значения X | Рихр P; (X <x;) 
21 0,05 >: -0,05 T5 0,20 0,85 
T2 _ 0,10 0,15 Tg С 930 0,95 
T3 0,20 0,35 17 0,05 $R = 00 
7 
T4 0,30 0,65 > 1.00 AFS 


Другим способом выражения закона распределения веро- 
ятностей значений дискретной случайной величины является 
кумулятивный ряд распределения. Кумулятивным рядом распре- 
деления будем называть совокупность вероятностей 


Е 
ах 
IP (X < z, = >à P i(t), (2.1.1) 


при kxn 


сопоставленных значениям X; дискретной случайной величины X 
(табл. 2.1.1 и рис. 2.1.1, 6). 

_ Так как множество возможных числовых значений дискретной 
случайной величины образует полную группу событий, то полная 
вероятность для ряда распределения равна единице: 


УР 1. | (2.1.2) 


* Отметим, что изображение ряда распределения в виде гистограммы 
или полигона (Вентцель) не правомерно. 
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Рассмотрим далее понятие закона распределения вероятно- 
стей для квантованной случайной величины. 

Факт появления значения X; квантованной случайной вели- 
чины X на {-том интервале А; снова можно Е как слу- 
чайное событие и характе- | | 
ризовать некоторой вероят- | а 
ностью | 


Р;(т<Х = а-^) или 
Pi (t; & Х<а,-+^) или 
Ри < X < z; tÀ) 

| (2.1.3) 


te =A aiaa Rh: 

Совокупность таких веро- 
ятностей (а также частот, 
частостей),  сопоставленная 
совокупности = интервалов 
квантования — непрерывной _ 
случайной величины образует 
полигон распределения или 
гистограмму распределения 
вероятностей значений кван- 
тованной непрерывной CHY- 
чайной величины. 

Наряду с вероятностью 
(2.1.3) важное значение имеет 
вероятность квантованной 
случайной величине Х при- Зо бл ща, 
НЯТЬ значение, меньшее или рис. 2.4.4. Графическое представление 
не большее, чем некоторое ряда распределения (а) и кумулятив- 


значение Lp, соответственно: ного ряда распределения (6). 
По осям абсцисс — значения X; дискретной 
Р(Х<т,) или 


Совокупность таких Pa 


случайной величины X, по осям ординат — 
(2 1 4) вероятности: P; (х;) нааи P} (Х < х;) на 6. 


P(X<z)= P, {pa AnA или 


i=1 


P(X% <n)= Рис < BDS A o 


k 
~ È P; (r; < X < z+ A) 
i=1 
при ии, 
0О=Р(Х = = Ъ 
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_сопоставленных совокупности интервалов квантования, образует 
кумулятивный полигон (или кумулятивную гистограмму) рас- 
пределения вероятностей значений квантованной непрерывной 


переменной. * 

z Формально аналитическое, табличное и графическое предста- 
вления полигона, гистограммы и кумуляты для квантованной слу- 
чайной величины те же самые, что и для упорядоченной, ранжи- 
рованной случайной величины ($ 1.4). Но по существу наших 
сведений об этих величинах здесь имеются два важных отличия. 
Первое отличие состоит в том, что интервал À у квантованной He- 
прерывной случайной величины может быть выражен любым дей- 
ствительным числом, а у ранжированной случайной величины 


Рис. 2.1.2. Схематическое 

(т) - изображение полигона pac- 

| пределения — вероятностей 

квантованной непрерывной 
случайной величины X. 
По оси абсцисс — ее значения 


х. По оси ординат — значения 
плотности вероятности. Хип —- 
акт область определения 
величины è X. Заштрихована 
7 «элементарная» трапеция; А — 
P hay интервал квантования и высота 
А этой трапеции, f’ (х;) — ее 
средняя линия. 


классовый интервал À — обязательно целое число. Второе отли- 
чие (оно, кстати сказать, обусловливает и первое), состоит в том, 
что у квантованной случайной величины интервал À точно опре- 
делен по значению самой величины, тогда как у ранжированной 
случайной величины классовый интервал семантически фиктивен: 
он лишь приближенно обозначает интервалы квантования, точные 
значения которых нам неизвестны. 

Указанные отличия позволяют гносеологически оправданно 
осуществить предельный переход от полигона, гистограммы и ку- 
муляты квантованной случайной величины к монотонным функ- 
циям, в общем и явном виде выражающим закон распреде- 
ления вероятностей значений непрерывной случайной величины. 

Чтобы ввести понятие закона распределения для непрерывной 
случайной переменной, рассмотрим «элементарную» трапецию ** 
полигона распределения, схематически изображенного на рис.2.1.2. 
Площадь этой трапеции (на рис. 2.1.2 заштрихована) численно 
равна вероятности того, что случайная величина примет значение 


на интервале À: 
| f (®).^=Р (1 = Хэ=щ- №, (2.1.6) 
где f (£) — средняя линия «элементарной» трапеции. 


* в линию, ограничивающую сверху кумулятивный полигон, 


называют кумулятой. 
** Аналогичные рассуждения можно провести и для «элементарного» 


прямоугольника гистограммы. 
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Очевидно, что уравнение (2.1.6) не изменится, если уменьшать 
высоту трапеции А и одновременно соответствующим образом 
увеличивать ее среднюю линию f’ (5;: 


а: (2-Е Ри ХА), ` 324) 


где a œ 0 — произвольная константа. Тогда, увеличивая KOH- 
станту «а» в (2.1.7), уменьшаем интервал квантования À до ec- 
конечно малой (но не нулевой) величины. В результате получаем 
некоторое значение средней линии «элемевтарной» трапеции f (5;), 
соответствующее бесконечно малому À и неизменной вероятности 
о. St + À). Это значение f (x;) будем называть meo- 
ретической плотностью вероятности. 

Теоретическая плотность вероятности показывает «удельное 
количество» вероятности, приходящееся на бесконечно малый ин- 
тервал значений непрерывной случайной величины. 

Очевидно, что каждому из бесконечно малых интервалов кван- 
тования 4х непрерывной случайной величины X соответствует 
некоторое значение теоретической плотности вероятности f (т), 
‚а совокупности таких значений соответствует совокупность плот- 
ностей. 

Функцию, устанавливающую соответствие между бесконечно 
малыми интервалами квантования d£ и плотностями f (x) будем 
называть функцией плотности распределения вероятностей, зна- 
чений непрерывной случайной величины — сокращенно — naom- 
ностью вероятностей — и обозначать f (2). 

‘Функция плотности, таким образом, это предел, к которому 
стремится ломаная линия, ограничивающая сверху полигон или 
гистограмму распределения при устремлении интервала квантова- 
ния À к нулю. * 

Аналогичный предел можем получить и для кумуляты. Для 
этого нам, в сущности, необходимо найти сумму бесконечно боль- 
шого числа слагаемых, каждое из которых есть вероятность f (x) ах 
появиться значению £ на бесконечно малом интервале 4х. Такую 
сумму будем называть интегралом и записывать следующим обра- 
зом: * 


F(z)= | 1 (2) а. | (2.1.8) 
“пп 
* Важно отметить, что при 45 =0 и Р (z< X< z+ À)= 0, как 


следует из формулы (2.1.6). Иначе говоря, в отличие о дискретной случай- 
ной величины для непрерывной случайной величины вероятность отдельного 
‚ значения (а PONI и соответствует 4х = 0) равна нулю. - 


** Знак Г читается как интеграл от min ДО Z, Zmin называется 


“min 


нижним пределом интегрирования, а £ — верхним переменным (текущим) 
пределом интегрирования. 


эт. 


Функция F (£), удовлетворяющая уравнению (2. 1.8), назы- 
вается (интегральной) функцией распределения вероятностей зна- 
_чений х непрерывной случайной величины X, сокращенно — 
функцией распределения. Она показывает версятность того, что 
случайная величина будет меньше или не превзойдет omaro из 
возможных значений, соответственно: 


ЕР 
или (7) l ) | (2.1.9) 
ЕЕ S | 
Очевидно, что все бесконечное множество значений непрерывной 
случайной величины образует полную группу событий. Поэтому 


тах 


Е()= | f(e)dr=4, = (2.1.10) 


тп 


где Lmin + Tmax — область возможных значений случайной вели- 
чины Х. 

Функция распределения F (£) и плотность вероятности f (x) — 
это две формы выражения закона распределения вероятностей 
значений непрерывной случайной величины. Знать одну из них — 
это значит полностью определить случайную величину. * 

Необходимо еще раз подчеркнуть, что на практике имеют дело 
не с бесконечно малыми, а с конечными значениями интервалов 
квантования À. Поэтому, обрабатывая данные психологических 
экспериментов, пользуются не теоретической плотностью вероят- 
ности, а эмпирической, которую получают из полигона или гисто- 
граммы делением вероятностей на Àj, например: 


1 (= = - Рив, = Х=а +»). (2.1.11) 


Таким образом, эмпирическую плотность вероятности можно 
рассматривать как вероятность, выраженную в единицах интер- 
вала квантования. ** Аналогично и вместо теоретической функ- 
ции распределения используется эмпирическая функция, в ка- 
честве которой выступает кумулята. При этом интеграл заменяется 
суммой, как в уравнениях (2.1.5). 


* Дифференцируя функцию распределения, получают плотность: 
а [F (2) = f (x), поэтому функцию плотности нередко называют дифферен- 
циальной функцией распределения. Зная одну из этих форм закона распре- 
деления непрерывной случайной величины, всегда можно найти другую: 
операции дифференцирования и интегрирования взаимно обратимы, так же 
как, например, ‘вычитание и сложение. 
** Из (2.1.10), очевидно, следует, что при; = 1, f (2) ЕР; (2) SX = 
< =; + ^;) плотность численно равна вероятности, 
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_ чаются только положе- 


о ЖОАЩ 
ая ое 


2.1.3. Основные свойства законов распределения 


Как и для упорядоченных переменных, законы распределения 
вероятностей случайных величин (дискретных и непрерывных) 


‘могут отличаться друг от друга положением на числовой оси 


(рис: 2.1.3, а), рассеиванием значений (рис. 2,1.3, 6), асимметрией | 
(косостью, скошенностью) рассеивания значений (рис. 2.1.3, в), 
а также оксцессом (выпуклостью, «кучностью») рассеивания 
(рис. 2.1.3, г). Эти четыре свойства по отдельности и в комбина- 
циях обусловлены как спецификой случайной величины, так и 
условиями ее наблюдения. Кроме того, будучи выражены ко- 
личественно, эти свойства являются параметрами большинства 


а б 


1 
AN 
2 

Å 
2 


Рис. 2.1.3. Основные 

свойства законов рас- 

пределения случай- 
ной величины. 


По оси абсцисс — значе- 
ния х непрерывной слу- 
чайной величины X; по - 


оси ординат — плотности 
вероятности f (x). 
а — кривые Ти? разли- é 


нием на числовой оси; 
б — кривые 1и 2 имеют 7 2 
одинаковое положение, 
но рассеивание меньше 
у кривой 1; в — кривые 
различаются только по- 
ложением и асимметрией: 
кривая 1 имеет положи- 
тельную асимметрию,, 


= 


кривая 8 — отрицательную, кривая 2 — нулевую (симметрична); г — кривые различа- 


ются только по дисперсии и эксцессу, для кривой 1 он больше. 


встречающихся на практике законов распределения. Поэтому вы- 
бирая меры, количественно характеризующие положение, pac- 
сеивание, асимметрию и эксцесс, во-первых, можно сравнивать 
случайные величины по выраженности отдельных свойств, а, во- 
вторых, во многих случаях можно C помощью выбранных мер 
определить в явном виде функции распределения. 

Меры, количественно характеризующие указанные четыре, 
а также и другие отдельные свойства закона распределения 
Не называются его числовыми характеристиками. {параме- 
трами 


$ 2.2. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ ЗАКОНА РАСПРЕДЕЛЕНИЯ 
2.2.1. Меры положения 


Мер положения много, но каждая из них преимущественно 
используется только в определенных условиях. 

Мода, уже известная нам по системам классифицированных 
и упорядоченных событий, — это значение случайной величины, 
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{ ис и аа 


имеющее наибольшую. вероятность` появления. Мода является 
единственно возможной мерой положения для существенно дис- 
кретной случайной величины. 

Для непрерывных случайных величин, имеющих «выпуклую» 
функцию распределения (см. рис. 2.1.3), мода определяется из 
условия максимума функции: 


-5 1 (2) =0 


Ae | (2.2.1) 
Е - 


_где A вероятности, = f (x)—ee первая ipons- 


водная и -7 z f (2) — ее вторая производная. 


Для квантованных непрерывных случайных величин с «вы- 
пуклой» гистограммой приближенно за моду принимается среднее 
значение классового ‘интервала А. Более точно значение моды по-. 
лучается по формуле. 


Р.— Pı 
‘где Мо — мода, z; — начало модального класса; À — классовый 
интервал; Р, — вероятность (частота, частость) класса, предше- 
ствующего модальному классу, Р. — то же для модального класса, 
P, — то же для класса, следующего за модальным. 

Необходимо отметить, что среди распределений встречаются 
«унимодальные», у которых мода отсутствует (рис. 2.2.1, а) и поли- 
модальные, у которых две и более мод (рис. 2.2.1, 6). * 

Медиана уже была рассмотрена применительно к распределе- 
нию вероятностей ‘ранжированной случайной величины. Точно 
также (стр. 70) она вычисляется и для квантованной переменной. 

Для распределения вероятностей значений непрерывной слу- 
чайной величины медиана определяется из условия: 


“тах 


I f (2) dr = a p de=05, — (2.2.3) 


in 


THe Tmin + Tmax — «границы» области наблюдения (существова- 
ния) случайной величины X; f(x) — ее плотность вероятности; 
Ме — медиана. 

Необходимо отметить, что для квантованных и непрерывных 
случайных величин медиана имеет ограниченное применение. 
А для дискретной случайной величины медиана в06се неприменима. 


* Полимодальные распределения, в сущности, представляют собой 
композицию одномодальных распределений и получаются в результате 
нестабильности условий опыта. 
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Средние 3 значения. Только для квантованных и непрерывных 
‚ случайных величин появляется возможность использовать в ка- 
честве мер положения средние значения: среднее гармоническое, 
среднее арифметическое, среднее квадратическое, среднее куби- 
ческое и так далее — среднее 21-ной степени, а также среднее. 
геометрическое. 
Среднее гармоническое (Н) определяется для непрерывной слу- 
чайной величины как 


и (2.2.4) 


Рис. _2.2.1. Унимо- 
дальные распределе- 
ния (а, кривые 1, 2, 
3, характеризуют paz- 
личные типы таких 
распределений) и по- 
лимодальное распре- 
деление (6). 
По осям абецисс — зна- 
чения непрерывной слу- 
чайной величины, по осям 


ординат — плотности BE- 
роятностей. 


а ДЛЯ квантованной соответственно как 
1 У 1 | 
ее E Pi (2.2.5) 


где P; — это сокращенное Р, (5; = Х < g - Л), а все осталь- 
ные обозначения прежние. Среднее гармоническое часто- исполь- 
зуется для оценки средних скоростей движения и частот колебаний. 

Среднее арифметическое (М) * р для непрерывной 
случайной величины как 


м f =) а, _ i (2.2.6) 
Xmin 


а для квантованной соответственно как 


М = > tıP; - 
3 i=] 
или j a | (2.2.7) 
1 
М = — Ò ху, 


i=1 


где Р, — частости или вероятности, f; — частоты на интервалах À. 


* Очень часто для среднего арифметического значения случайной ве- 
личины X в литературе используются обозначения: ху M T. 


= 
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C peðnee квадратическое (5) определяется для непрерывной 
случайной величины, как 


> “тах _ | 
= | 2/2) ат, (2.2.8a) 
| Xmin 
а для квантованной как 
= Хар. _ (2.2.86) 
i=1 


Среднее кубическое значение (0) и а «emie pmot степени 
(Q) определяются сходным образом: 


| 9 = у $ 23} (x) ах 
или | Хип (2.2.40) 


или Xmin | (2.2.10а) 


Важно отметить, что из перечисленных. средних основной Me- 
рой положения является среднее арифметическое значение. Среднее 
гармоническое используется как мера положения распределения 
частоты колебаний, а также скорости. Средние: квадратическое, 
кубическое и четвертой степени используются при вычислении 
мер рассеивания, асимметрии и эксцесса. 

Среднее геометрическое (С) определяется для квантованной 
случайной величины как 


"/ Пи, (2.2.41) 


где x — средние значения интервалов квантования №; f; — ча- 
стоты появления значений на #{-тых интервалах; или 


С—ПаР, (2.2.42) 


1=1 


n 

где Pı — вероятности (частости); ПП — обозначение произведения 
i=1 

poor g; при а. h 
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_ Среднее геометрическое вычисляется только при положитель- ` | 


ных 41; и используется, в частности, для определения эффектив- 
ности выполнения человеком последовательности рабочих опера- 
ций и для оценки среднего эффекта тренировки. | 

Логарифмируя (2.2.11) и (2.2.12), можно видеть, что логарифм 
среднего геометрического 


\ 


log G= p fı log z; = X, P; log z, (2.2.12a) 
s i=1 i=1 


— это среднее арифметическое (2.2.7) логарифмов значений кван- 
тованной переменной. В этой связи необходимо специально оста- 
новиться на понятии «среднего значения» (математическое ожи- 
дание). В теории вероятностей и математической статистике это 
понятие многозначно. С одной стороны, это понятие обозначает 
меру положения. В таком смысле оно и употреблялось выше. 
С другой стороны, понятие «математическое ожидание» означает 
специфическую операцию, смысл которой выражается следующим 


образом: 
M [21=-- X a= Хай = Хар 


для квантованной переменной Z, принимающей не более п воз- 
MOKHÞIX значений, И 


“тах 


м[21= f zf (2) dz 
"тп 

для непрерывной переменной Z, определенной на интервале 

(Zmin - Зах), Причем сама переменная Z может быть любой 

функцией (суммой, произведением, степенью и т. п.). Например, 

можно уравнение (2.2.12) записать, используя знак операции 

«математическое ожидание» (М [...]: ; 


n 
M [log G] = È log z,P,. 


t=] 


Наконец, имеется третье значение этого понятия, а именно: ма- 
тематическое ожидание как среднее арифметическое не любой, 
а генеральной совокупности (стр. 276) 

Отметим в заключение вопроса о средних, что между ними 
существует следующее отношение порядка: 


тп<Н<@<М«<5<ереднее кубич. < среднее четвертой сте-_ 
Пони (2.2.126) 
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2.2.2. Меры рассеивания 


~ Среди мер рассеивания наибольший интерес представляют pas- 
мах распределения и различные отклонения от мер положения. 

Размах распределения — это область наблюдавшихся_ значе- 
ний случайной величины: 


Е (2.2.13) 


Для дискретных случайных величин размах является единственно 
допустимой мерой рассеивания. Но для непрерывных случайных 
_ величин он лишь приближенно характеризует рассеивание. На- 
пример, кривые на рис. 2.1.3 имеют одинаковый размах, но разное 
рассеивание. 

Среднее (арифметическое: или абсолютное) отклонение для He- 
прерывной случайной величины определяется формулой 


Xmax 

|x —M,] f (2) dz, (2.2.14) 
} “min ` 
а для квантованной 

é n À 
; ô=) lz; —M;|-P, (2.5.15) 

1-1 
где |z — M, | — абсолютная величина (модуль) отклонения зна- 


чений T; случайной величины X от ее среднего арифметического 
значения М,; P; => f (1) 4х — вероятность (частость) появления 
значений на {-том интервале квантования. Несмотря на простоту 
вычисления, абсолютное отклонение имеет ограниченное приме- 
нение из-за ряда трудностей его использования в теории стати- 
стики. — 

Наиболее употребительной мерой рассеивания является стан- 
дартное (или среднее квадратическое) отклонение, определяемое 


как sF : | 
o =| VD,|, (2.2.16) 


где величина D,, называемая дисперсией, определяется уравне- 
НИЯмМи 


| (х—М,)*.} (<) 4х или 
О, =} “min (2:210 
pà (z; — Mx)”: P, 


соответственно для непрерывной и для квантованной случайных 
величин. 

Меньше распространено теоретически, но всегда используется 
практически другое определение дисперсии — как разности между 


94 


квадратами среднего Mareiro и среднего арифметического 
значений: 


р, =S2— M2, | (2.2.18) 


где S, — среднее квадратическое, согласно уравнениям (2.2.8) 
и (2.2.9); М, — среднее арифметическое значение, согласно урав- 
нениям (2. 5 6) и (2.2.7). 

Дисперсия тоже является мерой рассеивания, что м. 
в самом термине («дисперсия» и означает «рассеивание»). Однако 
там, где требуется учитывать качество (наименование) случайной 
величины, квадратическая мера, какой является дисперсия, не- 
удобна. Тогда применяется стандартное отклонение. 

Следует указать, что для «не очень» асимметричных распреде- 
лений справедливо приближенное равенство, связывающее сред- 
нее арифметическое и стандартное отклонения: 


8—0,8- 0. (2.2.18а) 


Стандартное отклонение можно определить по аналогии с полу- 
интерквартильным отклонением (стр. 71) ‘как половину вели- 
чины интервала рассеивания значений х непрерывной (или кван- 
тованной) случайной величины Х, в пределах которого вероят- 
ность появления этих значений составляет ~ °/.. Тогда между 
срединным отклонением (Е) и стандартным отклонением (0) имеется 
слодующее количественное соотношение: 


Е = 0,674. с. E (2.2.186) 


Отметим, что срединное отклонение Е редко используется B Ha- 
стоящее время применительно к непрерывным (и квантованным) 
случайным величинам. 

В отдельных случаях для сравнения рассеивания разноимен- 
ных случайных величин применяются безразмерные меры рас- 
сеивания. Одной из таких мер служит коэффициент вариация 
(вариативности), предложенный Карлом Пирсоном. 

Коэффициент: вариации определяется в долях или в процен- 
тах как отношение стандартного отклонения (с) к среднему apui 
метическому значению (М,): 


== (400%). (2.2.19) 


Важно помнить, что этот коэффициент существенно зависит от M,. 
Поэтому его применение для цели сравнения ограничивается теми 
случаями, когда распределения имеют одинаковые начала от- 
счета и одинаковые по модулю средние арифметические. Иначе 
сравнение может привести к ложному результату. 
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2.2.5. Меры асимметрии и экецесса 


Наиболее упс: ‚ребительной мерой асимметрии для непрерыв- 
ных и квантованных распределений является коэффициент асим- 
метрии (Аз), определяемый как 


j. (EMP da или 
Аз = Хин 1 2250) 


LS (z; — M,)? Рь 


i=1 


где все бои использовались выше. В отличие от квартиль- 
ного коэффициента (стр. 71), этот коэффициент асимметрии из- 
меняется в пределах 

-NL ASLAN. 


При Аз = 0 распределение считается симметричным (см. рис. 2.1.3, 
в, кривая 2), при Аз >> 0 распределение имеет «скошенность влево» 
(там же, кривая 1) и при As 0 распределение «скошено вправо» 
(там же, кривая 2). 

В качестве меры выпуклости (эксцесса) пользуется коэффи- 
циент эксцесса (Ех), определяемый как 


Xmax 


D (z —M,) f (2) а а 
Ех = (2.2.21) 


T У (и М,“ 3, 
-NL Ех< N. 


За «начало отсчета» выпуклости распределений принято значение 
коэффициента эксцесса для нормального закона распределения, 
для которого Ех == 0. 


$ 2.3. ОПРЕДЕЛЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ПО 
ЭКСПЕРИМЕНТАЛЬНЫМ ДАННЫМ 


При определении числовых характеристик изучаемой случай- 
ной величины по экспериментальным данным необходимо учиты- 
вать ряд обстоятельств. 

Во-первых, из числа указанных выше мер, характеризующих 
одно и TO же свойство закона распределения, необходимо выбрать 
ту меру, которая достаточно информативна с точки зрения цели 
исследования, а также применима к изучаемой случайной вели- 
чине, согласно ее специфике. Например, сравнивая две группы 
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людей по рассеиванию некоторого изучаемого психического свой- 
ства, можно воспользоваться приближенной оценкой рассеива-. 
НИЯ С помощью размаха. Если размахи значительно отличаются, 


допустим, 
ла=|а, —а, >15 или 2, 


то степень приближения к истинному ответу велика и применение 
размаха в качестве меры рассеивания оправдано. В противном 
случае следует воспользоваться более точной мерой — диспер- 
сией. Выше мы указывали, что для дискретной случайной вели- 
чины, в сущности, применимы корректно лишь мода и размах. 
Этим обстоятельством часто пренебрегают, поступая с дискретной 
переменной как с квантованной. Это может быть допустимо в слу- 
чае, когда совместно рассматриваются дискретные и непрерывные 
случайные величины, и целесообразно использовать одинаковый 
математический аппарат, но лишь при условии округления окон- 
чательных результатов (применительно к дискретной величине) 
до целочисленных значений. ВК непрерывной случайной величине 
можно применять BCE рассмотренные выше меры, в том числе, 
моду, медиану и размах, разумеется, если эти меры соответствуют 
задаче исследования. Наконец, в ряде случаев можно использо- 
вать вместо одного из средних значений другое, проще Bb- 
числяемое. 

Во-вторых, после того как нужная мера выбрана, следует для. 
нее подобрать вычислительную формулу, соответствующую мас- 
сиву экспериментальных данных и, по-возможности, обеспечи- 
вающую меньше субъективных ошибок при ее использовании. 
Дело в том, что большинство мер можно вычислять различными 
способами и наряду с «понятийными» формулами, приведенными 
выше, существует немало так называемых «вычислительных» фор- 
мул. В результате оказывается, что для маленького массива дан- 
ных лучше один способ, а для большого — другой; при вычисле- 
ниях вручную с помощью бумаги и карандаша — снова лучше 
один, на арифмометре — другой, а при машинном счете (на ЭЦВМ) 
третий способ. 

Важно подчеркнуть, что выбор необходамых мер и вычисли- 
тельных формул — это своего рода искусство, приобретаемое 
лишь на практике. 


2.3.1. Вычиеление мер положения, рассеивания, асимметрии 
и экецесса по несгруппированным данным 


Массив экспериментальных данных, составленный значениями 
4; случайной величины X, где i =1,2,..., п при 


№=80-- 100 _ (2.3.1) 


группировать не имеет смысла. Учитывая статистическое опреде- 
ление вероятности (стр. 15), можно видеть, что ‘при условий 
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f 


+ 


(2.3.1) нельзя получить устойчивые экспериментальные оценки 
вероятностей P (5;) или P (zı = X = z; + №). Поэтому здесь не 
применимы мода и медиана и большинство «понятийных» формул 
для других мер, рассмотренных выше. 

Вычисление средних значений в качестве мер положения здесь 
осуществляется в соответствии с общей Popayroy 


N 
Среднее = | > zh: (2.3.2) 


из которой, придавая показателю h и переменной х разные значе- 
ния, можно получить все вычислительные формулы. 

Для среднего гармонического значения, полагая в. (2.3.2) 
h = —1, получаем 


| АЕ (2.3.2а) 


Для среднего арифметического значения, полагая й = 1, получаем 


= Уз. | _ (2.3.26) 
#1 


Для среднего квадратического значения # =2 и 
А 
S= ya pa i (2.3-28) 
но | 
Для среднего кубического значения й =3 и 
3 
0 = и +a (2.3.21) 


Для среднего а степени Å= 4 
a PES 
4 n 
ET rA (2.3.27) 


i=1 


Наконец, для среднего геометрического значения, полагая k= Å 
и заменяя в (2.3.2) все z; их логарифмами, получаем 


N 
logG =F; Y log z;. (2.3.2e) 
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Кроме неравенств (2.2.12, 6), существует приближенное ли- 
нейное равенство, связывающее все степенные средние значения *: 


Š | 
5 "м ; (2.3.3) 


T, = 


где z, — среднее значение й-ей степени из числа рассмотренных 
с помощью формул (2.3.2)—(2.3.2г); h = —1, 0, 1,2, 3,4, ...; 
М — среднее арифметическое значение; D — дисперсия. Исполь- 
зование равенства (2.3.3) имеет смысл для приближенной оценки 
одних средних через посредство других, проще вычисляемых, 
например, через посредство среднего арифметического. Нужно при 
этом помнить, что использование равенства (2.3.3) ограничивается, 
во-первых, степенью асимметрии распределения, а во-вторых, 
величиной коэффициента вариации. Чем симметричнее распределе- 
ние и чем меньше рассеивание, тем точнее приближение формулой 
(2.3.3). 

Вычисление мер рассеивания осуществляется, за исключением 
размаха, через посредство мер положения: среднего арифметиче- 
ского и среднего квадратического значений. 

Среднее абсолютное отклонение вычисляется по формуле 


N 
=- Xlr —M]. (2.3.4) 


$=1 


Дисперсия вычисляется по формуле (2.2.18) как разность 
между квадратом среднего квадратического и квадратом среднего 
арифметического значений, а также непосредственно по формуле 


N 
= У =M}. (2.3.5) 


i=į 


Стандартное отклонение (6) и коэффициент вариации (У) 
вычисляются соответственно по формулам (2.2.16) и (2.2.19), ука- 
занным выше. 

Вычисление мер асимметрии и эксцесса выполняется через по- 
средство средних: арифметической, квадратической, кубической 
и четвертой степени: 


As = (0°— 3SM + 2M3) S O36) 


Ex = -iz (0% —40°M +6S?M? —3М) 3, — (2.3.7) 


* K. Джини. Средние величины «Статистика», M., 1970, стр. 180. 
См-также B.C. Ястремский. Некоторые вопросы математической ста- 
тистики. Госстатиздат, M., 1961, стр. 120. — j 


т | 99. 


” 


где A; — ее асимметрии; Ех — оби нае эксцесса; 
-O — стандартное отклонение; D — дисперсия; М — среднее ариф- 
метическое; S — среднее квадратическое; 9 — среднее кубическое; 
О — среднее четвертой степени. 

Кроме того, вычислить Аз и Ех можно непосредственно по pop- 
мулам : 


N 3 
As = № (z; —М)з (2.3.8) 


i=1 


N j a 
1 
Ex == », (2. —М). - | (2.3.9) 


$=1 


Следует, однако, заметить, что формулы (2.2.18), (2.3.6) и (2.3.7) 
предпочтительнее для вычислений вручную, чем формулы (2. 3.5), 
(2.3.8) и (2.3.9), соответственно, так как, рассчитывая разности 
x; — М), люди часто ошибаются. Тем не менее, наилучший путь 
для получения верного результата — это вычисления двумя раз- 
ными способами: совпадение ответов с приемлемой точностью 
гарантирует их верность. j 

Пример 2.3.1. Экспериментально определены скорости, с KOTO- 
рыми люди записывают цифры арабского алфавита (табл. 2.3.1) *. 
Требуется количественно оценить положение, рассеивание, CHM- 
метрию и эксцесс распределения значений скорости записывания 
цифр людьми по экспериментальным данным. 


Таблица 2.3.1 
Иеходные данные к примеру 2.3.1 


сть корость 
Цифра Ре: 1/сев Цифра зашиси, 1 [cen 

1 5,9 6 4,9 
2 3,1 7 2,8 
S 3,6 8 2,8 
4 sE 9 2.9 
5 2,1 0 5,0 

10 

2, 36,1 


i=i 


Для вычисления оценок всех мер положения, рассеивания, 
асимметрии и эксцесса, рассмотренных выше, нам потребуютея 
как это следует из формул (2. 3. 2)—(2.3.9), а также (2.2.16), (2.2.13) 


Zu Данные к примеру с некоторыми изменениями заимствованы из ра- 
боты: Н. М. Кандарацкова, Г. В. Суходольский. Об эффек- 
тивности и надежности элементарных вычислительных операций. В сб. 
Экспериментальная и прикладная психология, BHN. 1. Изд. ЛГУ, 1968. 
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$ x | ` 4 z ; 
и (2.2.19) следующие величины: Е lg z; 2; фи zj, а после Bh- 


_ числения среднего арифметического (М) разности: (21—М) и 
|z; — М}; (%-—М)?, (t;— M)’ и (5, — М)“. Эти величины и разности 

должны быть суммированы по i = 1,2, ..., 10, после чего по co- 
ответствующим формулам рассчитываются оценки мер. Выполним. 
расчет промежуточных величин и разностей в табл. 2.3.2 и 2.3.3. 


Таблица 2.3.8 


Промежуточные величины, необходимые для расчета оценок мер 
положения, рассеивания, асимметрии и эксцееса. Значения T; 
CM. в табл. 2.3.4 


3 s lg æ; x3 x3 x$ 
1 0,170 0,7709 34,81 205,38 4241,70 
2 0,323 0,4914 9,61 ` 29,79 92,35 
3 0,278 0,5563 12,96 46,66 168,00 
4 0,294 ' | 0,5345 11,56 39,30 133,63 
5 0,476 0,3222 |. 441 9,26 19,45 
6 0,222 0,6532 |` 20,25 91,12 410,40 
7 0,357 0,4472 7,84 21,95 61,47 
8 0,357 0,4472 7,84 21,95 61,47 
9- 0,345 0,4624 8,41 24,39 70,73 
40 0,200 -| 0,6990 25,00 125,00 625,00 
10 
> 3,02 5,3813 142,69 614,80 2853,90 


i=] 


Пользуясь формулой (2.3.2а) и суммой из второго столбца 
табл. 2.3.2, вычислим Ton гармоническое: 


H =-=- =i- a 3,31 (1/сек). 


Используя сумму из второго столбца табл. 2.3.1 и формулу (2.3.26), 
вычисляем среднее арифметическое: 


М=-9^ =3,64 (4/сек). ` 
Аналогично по формулам (2.3.2в)— (2.3.27) и суммам в четвертом — 
птестом. столбцах табл. 2.3.2 вычисляем среднее квадратическое, 


кубическое И четвертой степени соответственно; 


В Е 
3 
o = И £ 614.8 614,8 ~3,95 (4/сек), 


E У Bae 2853,9 ~ 4 11 (4/сек). 
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Takalik 28s 


Степени ам отклонений" ей к примеру 2.3.1. 
Значения х; ем. в табл. 2.3.1. 


i | x;—M (х,—М) (x; —M)? | (x; —M)* 
1 2,3 5,29 12,167 27,9841 
2 —0,5 0,25 —0,125 0,0625 
3 0,0 0,00 _ _ 0,000 0,0000 
4 —0,2 0,04. —0,008 0,0016 
5 —1,5 225: —3,375 5,0625 
6 0,9 0,81 _ 0,729 0,6561 
7 —0,8 Q,64` < |->. 70,512 0,4096 
8 —0,8 0,64 —0.512 0,4096 
9 —0,7 0,49 —0,343 0,2401 

10 1,4 1,96 2,744 3,8416 

10 

Di 0,1 12,37 _ 10,165 38,6677 


* Отклонения от среднего арифметического значения называются 
` «центральными». | 


эт 10 
Наконец, по формуле (2.3.2е) и У lg z; из. табл. 2.3.2, потенцируя 
| | Pear | | 


результат, определяем среднее геометрическое: 
С =апе ов 1-5 ‚3813 3,45 (4/сек). 


Можно видеть, что действительно средние значения разли- 
чаются между собой, и, если поместить среднее геометрическое 
между средним гармоническим и средним арифметическим, то 
отношение порядка будет соответствовать указанному неравен- 
ствами (2.2.126). После того как будут вычислены оценки для мер 
Ия мы еще раз вычислим все средние, пользуясь равен- 
ством (2.3.3 

Характеризуя рассеивание значений скорости записывания 
цифр человеком, вычислим сначала среднее абсолютное отклоне- 
ние. Для этого, не обращая внимания на знаки, заново сумми- 
prex Е от среднего арифметического во втором столбце 
табл. 2 


ô= 0,91. 


Здесь необходимо обратить внимание на то, что алгебраическая 
сумма второго столбца в табл. 2.3.3, составляющая 0,1, прене- 
брежимо мала как по сравнению с суммой х;, так и по сравнению 
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с суммой | 1, |. Теоретически, как мы покажем ниже, должно вы- 
полняться равенство - 


N 
È (1, —M)=0. 


t=4 


Ho практически, из-за округлений, это u S становится при- 


ближенным, т. е. 


у (1 —М) в, 


1=1 


где € — величина «второго порядка малости» (в десятки раз 
меньше, чем Èz, и È |2; — MÌ). 


Нетрудно. убедиться в том, что, если бы в примере централь- 
ные отклонения вычислялись при М — 3,61, а не при округлении 
с недостатком (М == 3,6), что значительно упростило расчеты 
в табл. 2.3.3, то равенство суммы центральных отклонений нулю 
выполнялось бы точно. 

Вычислим, далее, оценку дисперсии двумя способами. По pop- 
муле (2.2.18), используя полученные выше значения ' среднего 
арифметического и среднего квадратического, имеем | 


D = 14,269 — 13, 032 =1, 251. 


Подставляя сумму третьего столбца из табл. 2.3.3 в 'формулу 
(2.3. 5), получаем тот же а 


D= „12.37 4.299, 


следовательно, дисперсия вычислена без ошибки. 
По формуле (2.2.16) определяем оценку стандартного откло- 
нения: 


o =|У1,237 | = 1,44. 


Можем теперь сравнить оценки Ô и O по приближенному равен- 
ству (2.2.18а); действительно: 


0,91 
ERIE 20, 8. 
D 
Далее определим отношение м и по приближенному равенству 
(2.3.3) вычислим заново оценки остальных степенных средних: 
D `. 1,237 
wo aa 70:94 
H= 3,61 += .0,34 ~ 3,27, 


G= 3,81 n: .- 0,34 ~ 3,44, 
S= 3,61+ 0,5. 0,34 == 3,78, 
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li 
SA 
я 


; 0=3,64 + 0,34% 3,95, 
Q= 3,61 +0,75-0,34 ~ 4,12. 


Сопоставим полученные оценки с результатами непосредствен- 


ных расчетов в табл. 2.3.4. 
Таблица 2.3.4 


Сопоставление результатов вычисления ередних двумя способами 


Вычислено = Ошибка 
Вид ео обе есь ЕКО ВИ вЫ рае" ЧР ве пси нат часа 
т É: ss B %9 , 
начни Hegoen т зо olooto че 
ооо муле (2.3.3) ` посредственно. 
Н 3,31 3,21 0,04 EZ 
G 3,45 3,44 0,041 0,3 
M 3,61 — —- — 
+ 3,78 3,78 — = 
3,95 3,95 ° = 55 
Q 4,11 4,12 0,01 0,2 


Можно видеть, что использование равенства (2.3.3) не внесло су- 
_щественной погрешности в оценки разных средних. 

Сравнивая оценки значений средних разного вида, в частности. 
оценку М = 3,61 (1/сек) и оценку H == 3,34 (1/сек), необходимо 
отметить следующее. Как указывалось, для усреднения скоростей 
следует использовать среднее гармоническое. Но если разница 
между Н и М не велика (допустима, по мнению исследователя), 
то можно заменить Н на М. В данном случае эта разница соста- 
вляет несколько менее 10%, и в первом приближении ею можно 
пренебречь. 

Основываясь на среднем арифметическом значении в качестве 
центра рассеивания, вычислим двумя способами оценки для мер 
асимметрии и эксцесса. | 

Оценку для коэффициента асимметрии получим по формулам 
(2.3.6) и (2.3.8), подставляя в них значения из табл. 2.3.4: 2.3.3 
соответственно: | 


Аз == -(61,48 —3. z 21.3,61--2.41,05) == 


1 m 
AS ЕЕ = . 10,765 ==0,78. 


Точно так же, оценку для коэффициента эксцесса получаем по 
формулам a и (2.3.9) и тем же табл. 2.3.4 и 2.3.3 


ЕТ =0, 76, 


ВЕ — . (285,39 —4.61,48.3,61 + 6 - 14,269 - 13,032 — 
ci moan i ~ i 3~ —0,49, 
Ех — т 538,6677 ~ —0,47. 
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_ Легко видеть, что оба способа приводят к одинаковым рее 
татам с ошибкой менее 5%. 

Отметим, ‘заканчивая пример, что рассматриваемая совокуп- 
` ность скоростей записывания цифр имеет небольшую положитель- 
ную асимметрию и незначительный отрицательный эксцесс., Yun- 
тывая погрешность центрирования (= = 0,1), можно практически 
считать совокупность симметричной и нормально выпуклой. 


2.3.2. Группировка данных и получение эмпирической ' 
функции распределения 


B большинстве психологических приложений статистики основ- 
ной целью группировки экспериментальных данных является по- 
лучение эмпирических функций распределения, после чего уже 
по распределению вычисляются числовые характеристики. В от- 
дельных случаях целью группировки является только расчет чис- 
ловых характеристик. 

Получить эмпирические функции распределения можно, лишь 
оценив вероятности появления значений случайной величины. 
А для этого необходимо, чтобы массив группируемых данных имел 
объем * 


№ > 80 - 100. | (2.3.10) 


‚Для того чтобы функция распределения, полученная в результате 
группировки экспериментальных данных, наилучшим образом. 
соответствовала тому, что имеет место в действительности, необ- 
ходимо учитывать, с дискретной или непрерывной случайной 
величиной мы имеем дело, большое или малое количество разных 
‚значений случайной величины получено в опыте, значительно или 
незначительно различаются частоты «соседних» по величине 
значений и многое другое. В этой связи рассмотрим два способа 
и три принципа группировки экспериментальных данных. 

Первый способ группировки состоит в выборе интервала кван- 
тования À, границ zj, и средних значений W; интервалов группи- 
ровки, аналогично тому, как это было изложено для ранжирован- 
` ной переменной. Причем для дискретной случайной величины MH- 
тервал группировки определяется уравнением (1.4.2), которое 
здесь можно переписать в виде 


А — antf ах imi L, (2.3.11) 


THe Znin И max — Минимальное и максимальное из наблюдавшихся 
значений дискретной случайной величины, а в знаменателе дано 
количество интервалов (8—12), принятое для группировки. 


* В отдельных случаях оценить функцию распределения можно при 
N > 50 - 80. 
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`Для квантованной непрерывной случайной величины интервал 


‘группировки À может быть любым рациональным числом. Поэтому 
уравнение (1.4.2) в этом случае имеет вид 


у Ттах — Tmin 


82 e (2.3.14а) 


Поскольку (2.3.11а) может привести к иррациональному Л, здесь 
тоже приходится округлять его значение до некоторого «удобного». 
числа. Как правило, округляют так, чтобы А > Ах, где Ах — 
абсолютная погрешность измерения значений случайной вели- 
чины Х в условиях эксперимента. 

Границы классов 1; и средние значения и); интервалов BBI- 
бирают, либо MENON из условия: 


аа и Жи (2.3.42а) 
и тогда | 
ЖАРА | (2.3.126) 
и | 
== g -H0,50À, (2:9: t2B) 
tesk, Dea Paii для д, и ГЕ Ри для W,, 
либо исходя из условия: 
А Е (2.3.13а) 
и тогда | | 
zı =w; — 0,54, (2.3.136) 
и м: 
Wap WHA | (2.3.13в) 


После того как определены все границы 5; и средние значе- 
ния ш; интервалов, необходимо разнести экспериментальные дан- 
ные по интервалам. Так как среди наблюдавшихся значений L; 
могут встретиться такие, которые численно равны значениям гра- 
ниц 2,, то необходимо корректно распорядиться их размещением. 
В этой связи существуют три принципа размещения «граничных» 
значений Lj. 

Первый принцип основывается на условии 


М (2.3.14a) 


T. €. каждый интервал группировки считается открытым справа. . 
Второй принцип основывается на условии 


Хе | (2.3.146) 


т. €. каждый интервал группировки считается открытым слева. 
Наконец, третий принцип основан на условии 


Е, с (2..3.14в) 
т.е. каждый интервал группировки замкнут слева и справа. 
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о So 
X > 
WS 


Различие В условиях (219. 14) и - к тому, что Некоторов 
ограниченное значение Lj =Z; согласно первому принципу OTHO- 
сится в интервал Ajy (см. рис. 2.3.1), согласно второму.— в HH- 
тервал Л;, а согласно третьему — размещается Е интерва- 
лами, непосредственно на границе zy. 


Необходимо отметить, что на практике чаще всего исполь- . 


зуются первый и второй принципы, поскольку так легче выполнять 
группировку. Однако нетрудно показать, что оба эти принципа 
ведут к смещению эмпирического распределения в сторону от его 
истинного положения на числовой оси Х: первый принцип дает 
смещение вправо, а второй — 
влево. Величина смещения по- 
ложительно зависит от коли- 
чества «граничных» значений 
среди экспериментальных дан- 


ных и от величины интервала = Ñnpunun | Inpunuun 
группировки. Конечно, появле- Аи 
ние «граничных» значений Z; | 
обусловлено тем, как выбраны Ri S 
границы z; Поэтому всегда p A 


следует попытаться, выбирая 
границы 2; интервалов груп- 
пировки, минимизировать число _ 

Рис. 2.3.1. Схема, поясняющая три 


АИ E O ел принципа размещения «граничных» 
чении в массиве эксперимен- значений 2; квантованной случайной 
тальных данных. Все-таки . величины X, 

обычно не удается избежать их 

появления, а величину смещения нельзя априори установить. 
Поэтому лучше при группировке данных вручную * использо- 
вать третий принцип. 

Пример 2.3.2. В опыте по изучению амплитудно-частотной 
характеристики руки человека-оператора для одного из испытуе- 
мых получены значения амплитуд установившихся колебаний 
руки (табл. 2.3.5). Требуется определить эмпирическую функцию 
распределения. | | 

Осуществим группировку данных по первому D Для 
этого из табл. 2.3.2 определим значения _ 


AA мм и их =82 MM: 


Lig Pii Tı Wi Bir 


Tmin — 


Тогда по уравнению (2.3.14а): 


87—44 
ею 


Так как измерения амплитуды проводились с абсолютной ошибкой 
+0,5 мм, т.е. — с точностью до 1 мм, округлим значение À 


= 4,1 MM. 


* При использовании автоматической группировки приходится Npene- 
бречь смещением и использовать первый или второй принципы размещения 
«граничных» значений Е - и величины. 
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_ Таблица 2. $ 5 


Jiasenns zj амплитуды установившихея колебаний руки 
испытуемого, MM 


ее =: 


63 64 71 66 68 63 62 41 
55 59 58 62 64 67 98 05 
56 64 60 82 60 62 52 24 
64 65 64 54 71 62 62 08 
61 60 70 74 61 66 61 51 
65 63 73 58 62 58 61 98 
69 29 52 55 55 66 67 62 
65 60 29 62 51 72 60 62 


} 
> 
с недостатком до À = 4 мм. Выберем, далее, zı = 40 мм <<, 
и определим по уравнению (2.3.126) остальные границы (табл.2.3. 6): 
EAS a E AE 

Кодируя «палочками» эмпирические значения амплитуды из 
табл. 2.3.5, осуществим группировку данных в соответствии с каж- 
дым из трех принципов размещения «граничных» значений Z; 
(табл. 2.3.6 и 2.3.7). 

Так как при построении гистограммы или полигона распре- 
деления частоты f; сопоставляются средним значениям #тых HH- 
тервалов W;, то при использовании третьего принципа размеще- 
ния «граничных» значений £; их частоты (они отмечены «палоч- 
ками» на границах в табл. 23.7) следует поровну распределить 
между соседними интервалами. Поскольку частоты «граничных» 
значений могут быть нечетными числами, то используется услов- 
ная дробная оценка окончательных частот },, сопоставляемых зна- 
чениям 1. Сравнивая значения частот из табл. 2.3.6 и 2.3.7, 
можно видеть, что интервальные частоты, полученные с исполь- 
зованием третьего принципа — это средние из частот, полученных 
с использованием первого и второго принципов: 


|: (т; = Х = 11) =0,5 { (т; = Хан) ЕР (1<Х=«атш)]. 
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Группировка данных, соглаено первому и второму принципам 


Таблица 2.3.6 


размещения «граничных» значений. 


Первый принцип (x; < Х<х; +1 Второй принцип (х<Х<х; +1) 
xj х;.1 (мм) | Кодирование fi (X> Xj, (mm) Кодирование fi 
4044 ||| 2 40-44 ||| 3 
44-48 ||| 3 44-48 ||| 3 
4852 |T lIl 9 48-52 |m] M II 14 
52-56 |U pp p Ш! 25 52+56 ИИ pn UH p U 25 
56-60 |m Ш pm Ш ПИ | 29 | 56-60 ИН 39 
60-64 [u m Wi pm umi 58 | 60564 (u mauu ини т! 52 

S то В Hi ИН pn 

62 =-68 m M a M i 37 6468 |1 LU y Lm lil 34 
о 
68-72 | Ш ПИ И | 22 68-72 |m H1 Пи ll 19 
72-76 |ui || 13 72-76 |! 9 
76 80 -0 76-80 || T4 
80-84 || о 80—84 | о 1 
Умма, 200 о E a 200 


Носле того как частоты определены, следует вычислить часто- 
сти р;. Для этого необходимо определить объем совокупности 
_ после группировки (№): - | 


Е 
=Ñ fi 


$=1 


(2.3.15). 


где k — количество интервалов группировки, и затем вычислить 
частости 


(2.3.16) 


Дело в том, что при значительном количестве экспериментальных 
данных (несколько сотен и более), в процессе их разнесения по ин- 
тервалам отдельные значения — обычно из числа частых — могут 
быть случайно пропущены или закодированы дважды. Повторное 
разнесение данных не изменяет положения, так как допускаются 
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| Таблица 2.3.7. 
Группировка данных, согласно третьему принципу 7 
размещения «граничных» значений 


—щри, 


Третий принцип (x; < X< £j) 


XiX, g (MM) Кодирование fi 

40-44 | | SEak 
| | | 

44 + 48 || пе. 3,0 
| 

48-52 пи. 11,5 
ПИ | 

52-56 ПИШИ 25,0 
ИН | 

56 -= 60 НИ пи Шо TI 34,0 

_ 60-- 64 u gn МИ ga М МЕ | 55,0 

mn L | 

64 = 68 U gj МИ g НИ | 35,5 

68 -= 72 ma L mi 20,5 
ii : 

72—76 пи IHl 11,0 

76 -80 а 0,5 

| | 
80 -- 84 | 1,5 
EV EMA ра nR к 200,0 


новые ошибки. Сами по себе ошибки такого рода (1—2%) не 
влияют на полученное распределение. Но, поскольку №’ Æ N, 
N 


_ а требуется, чтобы р Р; = 1, частости вычисляются здесь по фор- 


муле (2.3.16). > 

Частости распределения к примеру 2.3.2 приведены 
в табл. 2.3.8, а соответствующие полигоны — на рис. 2.3.2. 

Эмпирическое распределение, полученное в результате груп- 
пировки, наилучшим образом соответствует экспериментальным 
данным тогда, когда среднее арифметическое значение, вычислен- 
ное по распределению, почти не отличается от вычисленного по 
несгруппированным данным. Это обусловлено тем, что при груп- 
пировке фактически наблюдавшиеся значения L; изучаемой слу- 
чайной величины X заменяются средними значениями W; интер- 
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Таблица 2.8.8 


Частости эмпирического распределения значений амплитуды - 
уетановившихея колебаний руки испытуемого по данным примера 2.3.2 


_ плети олень EOE T A AREER от изыски очи же еж кажеться теля оливы ито ты: i- A C OOE N шие исчо м СУГ ИТГ. анна чо ети три тн оли 
Принципы размещения «граничных» значений 
W 


i gng MM Fe u ETE S < ‚Рух < а 
г %;+1) < х;+1) < X41) 
1 40 = 44 42 0,010 0,015 0,0125 
2 44 = 48 46 0,015 0.015 i 0,0150 
3 48- 52 50 0,045 = 0,079 0,0575 
4 52 — 56 54 0,125 0,125 0,1250 
5 56—60 — 58 0,145 0,195 0,1700 
6 60 -- 64 62 ‚ 290 0,260 0,2750 
T 64 -- 68 66 0,185 - 0,170 ‚0,1775 
8 68 -= 72 70 0,110 0,095 0,1025 
9 72 =- 76 T4 0,065 0,045 0,0550 
10 _ 76-80 78 0,000 0,005 _ 0,0025 
11 80-84 — 82 0,010 0,005 0,0075 
Cy Hun > | 1.000 | 1,000 | 10000 


валов группировки, и интервалы должны быть выбраны таким 
_ образом, чтобы среднее значение одного из них было совмещено 
со средним арифметическим значением наблюдавшейся совокуп- 
ности. Первый способ группировки, рассмотренный выше, не по- 
зволяет априори оценить среднее значение интервала, наиболее 


KS 
РР 
NA 
ð AAA 
38 46 54 62 70 Ey. 86 


Рис. 2.3.2. Полигон распределения значений амплитуды по 
данным примера 2.3.2. 
По оси 1 абсцисс — амплитуда колебаний, мм, по оси ординат — 
частости. Разновидности полигона 171,2 и 3 получены в результате 
использования разных принципов размещения «граничных» значений 
(первого, второго‘ и третьего соответственно). 
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близкое. к желаемому. В этой связи рассмотрим второй способ 
группировки экспериментальных данных, более трудоемкий, но 
зато гарантирующий лучшие результаты. | 

Второй способ группировки можно представить в виде следу- 
ющей процедуры. 

Из массива экспериментальных данных определим мини- 

мальное (Z in) и максимальное (Z pax) значения. 

- 2. Нолагая, что все наблюдавшиеся значения х получены 
в результате равноточных измерений, с точностью Ах *, запишем 
возрастающий ряд из А возможных значений: 


Zmin) Tmin E AT: Tas CEAR: e3 Lmin + (k—2) At; T max’ (2.9.17) 


Где Zmax = min + (k — 1) Ах и k — натуральное число. Отме- 
тим, что некоторые из возможных значений х, (j = 1, 2,..., 
К) среди экспериментальных данных могут случайно отсутство- 
вать. Отметим также, что К эквивалентно количеству интервалов 
трунпировки величиной Ах: 


| 
В as iTi (2.3.18) 


и требуется, чтобы М№ > k, иначе группировка может не иметь 
смысла. Отметим, наконец, что при большом [V высокоточных из- 
мерений (Ах мало) Е оказывается столь большим (несколько сотен 
и более), что второй способ группировки неприменим и следует 
воспользоваться первым способом. 

3. Последовательно просматриваем массив эксперименталь- 
ных данных, и, кодируя их «палочками», как и прежде, HOCAM- 
тываем, сколько раз фактически встречается каждое из k возмож- 
ных значений Tj; таким образом определяем частоты f; (x). 
Очевидно, некоторые из возможных значений фактически могут 
и не встретиться и соответствующие частоты окажутся тожде- 
ственно равными нулю. Далее, в зависимости от ряда условий, 
возможны следующие варианты. 

Вариант 1. Для целей исследования можно ограничиться 
расчетом числовых характеристик; тогда группировка закончена. 
Если же необходимо прежде всего определить эмпирическую 
функцию распределения, то следует учесть, получен ли при AAH- 
ном А непрерывный и «достаточно гладкий» ряд частот f; (5х). 

Вариант 2. При k = 8 — 12 и более из числа возможных 
значений £; фактически наблюдались все **, и частоты f; (x;), 
будучи изображены на графике, образуют «достаточно гладкую» 
последовательность (рис. 2.3.2). В таком случае остается, исполь- 
зуя формулы (2.3.15) и (2.3.16), вычислить значения частостеи р; 


* Если измерения были неравноточными, то за Ах принимается удвоенная 
абсолютная, либо стандартная погрешность наименее точного измерения. 
** Для одного-двух значений на краях ряда допустимо /, (1;) =0. 
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Сопоставляя частости р; и значения х,, для дискретной случай 
ной величины Х можно получить эмпирический ряд распределе 
ния, а для квантованной случайной величины можем построить 
полигон или гистограмму, пользуясь методами, изложенными 
выше. 

Вариант 3. При k= 12 для некоторых значений ` t; 
в середине ряда получены «нулевые», либо низкие значения ча- 
стот, т.е. последовательность частот либо прерывиста, либо 
«пилообразна» (либо и то и другое вместе). Тогда необходимо про- 
должить группировку, укрупняя интервалы Ах. 

Новый, укрупненный интервал (À) выбирается, исходя из CO- 


отношения | 
| АША, (2.3.19) 


Здесь u= 2— натуральное число, которое определяется из 
условия 


где 2=8- 12; иногда допустимо 2=7. 

Далее, необходимо выбрать «начало отсчета» — среднее зна- 
чение интервала, наиболее близкое по величине среднему арифме- 
тическому значению, вычисленному по несгруппированным дан- 
НЫМ. aR Е 
Наилучший, хотя и самый длинный путь — это непосред- 
ственный расчет среднего арифметического значения по методу 


«взвешенной средней»: 
k 


M= — Ñ tfj DORE ORA 


k 
$; уу 


9—1 


где Z; — возможные значения измерявшейся в эксперименте слу- 
; i В 


чайной величины X; k — количество таких значений; У = № — 

| 1=1 
количество экспериментальных данных, фактически сгруппиро- 
ванных для получения частот f;. Некоторые из частот могут 
быть равны нулю. Затем с точностью до Ах выбирают ближай- 
шее к вычисленному по (2.3.20) М — среднее значение W; неко- 
торого `“ 1-того интервала, после чего, пользуясь формулами 
(2.3.13в) и (2.3.12в), определяют бредние значения остальных 
интервалов и все границы Lj. 

Далее осуществляется перегруппировка частот. Частоты, при- 
надлежащие значениям Lj, расположенным «внутри» укрупненных 
интервалов À, суммируются. Частоты «граничных» значений 
£; = z; размещаются по одному из трех рассмотренных выше 
принципов, лучше всего — по третьему. a 

В случае, если ряд из k значений z; с сопоставленными им 
частотами f; приблизительно симметричен относительно модалу- 


~ T. В. Суходольский 4413 
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ного значения (например, как в табл. 2.3.9), то это модальное 
_ значение (Мо) и принимается за оценку среднего арифметического 
значения, которое в этом случае не нужно вычислять. Тогда при- 
нимают за «начало отсчета» среднее значение W; ближайшее 
к моде Мо. 

Таблица 2.3.9 


Группировка данных из таблицы 2.3.5 вторым способом 


j ( р Кодирование HE] хуем) Кодирование F 
frg -FA 22 | 62 | ПИШИИНЦИЙЙ| 2 
sipe] 1| 23 | 63 | НИПИ | 114 
3 | 43 0] 24 | 64 | ПИНИ 10 
= 11 25 | 65 | ПИНИИ 12 
ЕЕ. 1 26 | 66 | ПИН 9 
6 | 46 | T ИН] 6 
7 | 4 o 28 | 68 ПИ 7 
8 | 48 | 1| 29 | 69 ||| 2 
9 | 49 | 1 30 1 70 И 7 
101 50 | let Far АТН 6 
14 | 54 LTL 6:32 |- 72 РА 4 
Fa Г-Н 6| 33 | 73 TAIT = 
13 | 53 Е 3] 34| 74 || 1 
14 | 54 | ШИН 6| 35 | 75 |1 3 
15 | 55 ИНН 40| 36 | 76 0 
16 | 56 mE 6137 E7 0 
41-Е.52 ИИ 5| 38 | 78 0 
48 | 58 | ПИННИНИЕ [43| 39 | 79 0 
19 | 51 HH 5| 40 | 80 || 1 
20 | 6o | ПИННИИИ | 16] 41 | 81 0 
21 | 61 НИ | 6| 42 | 82 || с 

Сумма частот 200 


II римечание. 1=1 2,...,  —номер возможного значения Tj слу- 
чайной величины X. Поскольку фактически наблюдались не все Lj, неко- 
торые частоты fj =Q, 


Пример 2.3.3. По данным предыдущего примера 2.3.2 осуще- 
ствить группировку вторым способом; вычислить «взвешенное» 
среднее арифметическое значение. 

Так как значения амплитуды определены с точностью до 1 мм, 
т.е. Ах =1 мм, по формуле (2.3.18) устанавливаем, что коли- 
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чество возможных значений (х;) амплитуды при daa = 48мм 
и Zmar = 82 мм составляет k = 42. Используя (2.3.17), строим 


ряд возможных значений Tj, этот ряд представлен в табл.:2.3.9. 


Кодируя как обычно «палочками» значения амплитуд из 
табл. 2.3.5, подсчитываем частоты f; возможных значений Tj; 
они также приведены в табл. 2.3.9. | 

’Поскольку k » 12, а последовательность частот в т 2.3.9 
прерывна и «пилообразна», можем, согласно варианту 3, укруп- 
нить интервалы Ах. По соотношению (2.3.19) выберем новый 
интервал группировки | 


=Ë Az (мм), 


где Ax=1 мм, k==42, a 2 примем равным десяти, поэтому 
т ASM 
ant} =4 и, следовательно, À =4 MM. 


Теперь для построения основания ряда распределения амплитуд 
необходимо выбрать в качестве «начала отсчета» одно из средних 
значений W, интервалов, наиболее близкое (с точностью до Ах) 
к среднему `арифметическому значению несгруппированных дан- 
ных. Так как взвешенное среднее арифметическое значение, 
определенное по формуле (2.3.20), в точности равно среднему 


‚ арифметическому значению, вычисленному по формуле (2.3.26), 


то определим взвешенное среднее ‚ арифметическое, вычисляя, 
как показано в табл. 2.3.10. Разделив сумму произведений zf; 
на сумму частот (200), получаем 


12 315 


5 = 61,575 (мм). 


М [z;]= 


Сопоставляя среднее арифметическое значение с модальным 
значением из табл. 2.3.9, видим, что различие между ними прак- 
тически отсутствует. Этого следовало ожидать, так как ряд рас- 
пределения в табл. 2.3.9 почти симметричен (62 — 41 ~ 82 — 62). 
Следовательно, можно было бы выбрать за «начало отсчета» моду, 
полагая и, = 62 и далее: z; = Ш; — 0,5^ = 60, Zui = ш + 
{+ 0.5^ = 64, а затем, вычислив по уравнениям (2.3. 126) 1 и i (2. 3. 132) 
остальные Z; и W;, построить то основание ряда распределения 
амплитуд, которое и было использовано в примере 2.3.2. Но 
можно, ORpyTIEB среднее арифметическое значение C недостатком 
= 61,5 mm * принять его за «начало отсчета», положив: W; = 61,5, 

= 615 — > 505 и 2,1 = 61,5 +2 = 63,5. После этого 
по уравнениям (2.3.126) и (2.3.13в) определяют границы и сере- 
дины интервалов, приведенные в табл. 2.3.11. Там же указаны 
частоты }, полученные суммированием частот f; из табл. 2.3.9, 
относящихся к значениям Tj, заключенным внутри укрупненных 


* Такое округление не лишено смысла, если учесть, как указывалось, 
что измерения проводились с абсолютной ошибкой +0,5 мм. 
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Таблица 2.3.10 


Промежуточные результаты 
к вычислению среднего арифметического значения по (2.3.20) ~ 


1 2 3 
Xj» MM 7 | xf; Kyi MM fi | xfi pi fi eaf 
41 1 41 59 10 550 69 2 | 138 
42 1 42 56 6 336 70 7 490 
45 0 0 57 9 289 71 6 426 
44 1 44 58 13 754 12 4 288 
45 1 45 59 5 295 73 5 365 
46 1 46 60 16 960 74 1 74 
47 0 0 61 6 366 75 3 5 
48 1 48 62 25 1550 76 0 0 
49 1 49 63 11 693 77 0 0 
50 1 50 64 10 640 78 0 0 
51 6 306 65 12 780 79 0 0 
52 6 312 66 9 594 80 1 80 
53 3 159 67 6 402 81 0 0 
54 6 324 68 7 476 82 1 82 
Сумма (по j) произведений х/]; 12315 


Таблица 2.3.11 


Результаты группировки значений амплитуды (из табл. 2.3.5) 
по второму способу при укрупнении интервала группировки 


1 w fi Pi 

$ 39,5 = 43,5 41,5 2 0,010 
2 43,5 = 47,5 45,9 3 0,015 
J 47,5 = 51,5 49,5 9 0,045 
4 54,5 = 55,5 53.5 25 0,125 
5 55,5 = 59,5 9,9 29 0,145 
6 59,5 = 63,5 61,5 58 0,290 
7 63,5 -= 67,5 65,5 kyi 0,185 
8 67,5 = 71,5 69.5... 22 0,110 
9 71,5 -- 75,5 EET f ATA 13 “ 0,065 
10 15,5 -- 79,5 Tea 0 0,000 
11 79,5 -= 83,5 81,5 2 0,010 
Суммы 200 1,000 


Примечание. Заметим, что частости р; численно равны частостям 
р; (tı KX Szt) из табл. 2.3.8, но сопоставлены они здесь средним значе- 
ниям интервалов, сдвинутых ‘влево на 0,5 Ах по сравнению со средними MH- 
тервалов в табл. 2.3.8. Этим и компенсируется противоположно направ- 
ленное (вправо) смещение положения ряда, обусловленное использованием 
первого принципа размещения «граничных» значений. 
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интервалов À. Далее по формуле (2.3. S) определяют частости Pj, 
они тоже приведены в табл. 2.3.11. 

После изложения методов расчета числовых характеристик 
по распределению, мы покажем, что и при w; = 62 и при w; = 
= 61,5 числовые характеристики положения и рассеивания, Bbi- 
численные по частостям р, (1; = X < zı) из табл. 2.3.8 и по 
частостям р; из табл. 2.3.11, совпадают в rapax точеости изме- 
рений. 

Необходимо заметить, что частости р; в табл. 2.3. 1 опре- 
делены вне действия трех принципов размещения «граничных» 
значений, которые при выборе w; = 61,5 ~ М [х,| отсутствуют. 
Но, если бы, например, М [2, p= 62, TO для получения несмещен- 
ных оценок параметров нужно было бы использовать третий 
принцип размещения «граничных» значений. 

Пример 2.3.4. В экспериментах по изучению точности подрав- 
нивания человеком яркости объекта под эталонную яркость на 
серийном фотометре ФМ-58И в одной из серий опытов получены 
100 значений модуля ошибки подравнивания, которые предсета- 
влены в табл. 2.3.12 (Ошибка подравнивания определялась по 


Таблица 2.8.12 


Исходные данные к примеру 2.3.4 — 
— значения модуля ошибки подравнивания яркоети в % 


1 2 3 4 5 
0,3 ` 0,7 0,2 0,4 0,1 
0,9 0,0 0,1 0,2 0,7 
0,7 0,6 0,3 0,3 0,5 
0,4 0,6 0,1? 0,1 04 
0,4 0,7 0,8 0,2 0,2 
0,5 0,3 0,5 0,3 1,1 
0,1 0,8 0,4 0,3 0,2 
0,5 1,2 0,5 1,2 0,3 
0,1 0,1 0,3 0,4 -0,1 
0,0 0,4 0,3 0,4 0,1 
0.0 0,3 0,9 0,4 0,2 
0,3 0,3 1,1 0,3 0,0 
1,4 0,2 09 0,4 0,4 
0,6 0,4 0,2 0,4 0,3 
0,3 0,3 0,3 0,1 0,0 
0,1 1,0 08 0,4 0,7 
0,5 0,2 0,3 0,3 0,3 
0,3 0,4 0,1 0,4 0,4 
1,4. 0,2 0,1 1.0 0,3 
0,4 0,4 0,1 0,4 0,2 


Примечание. Абсолютная погрешность считывания 
значений ошибки со шкалы барабана может быть принята 
= 0,05%, следовательно, точность измерений определяется 
величиной Ах =0,1%. 
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| 

шкале регулировочного барабана, в процентах от величины эта- 
лонной яркости). Осуществим группировку данных по второму 
способу. 

Пятнадцать (k возможных значений ошибки подравнивания, 
взятой по модулю (52,), представлены в табл. 2.3.13. Там же осу- 
ществлено кодирование данных, подсчет частот и вычисление 
среднего арифметического значения модуля ошибки М [х/. 


Таблица 2.3.18 


Группировка значений ошибки подравнивания 
по второму способу и вычисление «взвешенного» 
среднего арифметичеекого значения 


j Èi (%) Кодирование fi xfi 
1 | 00 | ПИ | 5 | 0,0 
R 2 | 0,4 | ПИ НИ Ш | 14 | 1,4 
3 | 0,2 ^ | М.Ш | 11 | 2,2 
4 | 0,3 ПМ ПМ | 29 | Е 
5 | 0,4 | mi U U | 20 | 8,0 
6 | 0,5 | И | | 6 | 3,0. 
7 a 0;6 | II | 3 | 4,8 
g-o | 0,7 | И | 5 | 3,5 
9 | 0,8 | Ill | 3 | 2,4 
10 | 0,9 | |] | 3 | 2,7 
11 | 1,0 | | | 2 | _20 
12 | A | || | 3 | 3,3. 
13 | 12. | | у | g | 2,4 
14 | 1,3 | | 0 | 0,0 
15 | 1,4 | | 1 1,4 
Суммы . 100 40,7 


Среднее арифметическое значение М [2;] = 0,407. 
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Так как ряд частот f; имеет «пилообразную» форму 
(табл. 2.3.12), то можно укрупнить интервалы вдвое: a 


k 15 
Z Asr= 20,1 ~ 0,2 (%). 


Можно видеть, что модальное значение х; = 0,3% более чем 
на Âz отличается от среднего арифметического значения. Поэтому 
для центрирования данного асимметричного ряда распределения 
выберем 


wi~ М [5;] =0,4 (%). 


Тогда w; = 0,4 — 0,2 = 0,2 n w; = 0,6. Далее по уравнениям 
(2.3.126) и (2.3.13в) определим все остальные границы £, и Cepe- 
дины интервалов Wj, они приведены в табл. 2.3.14. Заметим, что 
возникает трудность с определением границы 42\: ведь модуль 
всегда положителен. В этой связи приходится принять «нулевой» 
интервал вдвое меньшим, чем все остальные (A = Ах = 0,54,, 
при i = 2, 3,..., Nn), однако значение частоты f} необходимо 
сопоставлять не среднему значению этого интервала, а его левой 
границе, т. e: д, = 0 *. 
Таблица 2.3.14 


Результаты группировки значений ошибок подравнивания 
при укрупнении интервалов группировки 


Кр 2i fi | wfr 

0,0 = 0,4 0,0 12 0,0 

0,1 = 0,3 0,2 29 5,8 

0,3 - 0,5 0,4 ЗА 13,6 

0,5 = 0,7 0,6 8,5 5:4 

: 0,7 -= 0,9 0,8 4 5,6 
0,911 19: 5 5,0 

1,1 -—4,3 1,2 3:9 4,2 

1,3 -= 1,5 TE 1 1,4 
Суммы 100 40,7 


Примечание. Принято, что ш1 =Œ 11. 


При определении частот f; для укрупненных интервалов MC- 
пользуем третий принцип размещения «граничных» „значений 


* Дело в том, что положительные и отрицательные значения ошибки 
подравнивания, имеющие модуль 0 = 2; S 0,1, теоретически равновероятно 
должны распределяться относительно нулевого значения. 


с 
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случайной величины. Следовательно, новые частоты f; могут быть 
определены равенством: 


fi (2, = X S дна) = Jà filtet <in) +0,5f; (£; =) + 
Е 
+ 0,5}, (£; = Liy) | (2.3.21) 


TIo. >. fi (z; < zi < 1.) —сумма всех частот, принадлежащих 


они т, «внутри» укрупненных интервалов, а 0,5}, (z; = 2;) 
и 0,5f; (7, = Zi) — половины частот «граничных» значений. 

_ Полученные по (2.3.21) в соответствии с данными табл. 2.3.13 
новые частоты f; представлены в табл. 2.3.14. 

Чтобы проверить, хорошо ли выбрано «начало отсчета», BBI- 
числим взвешенное среднее арифметическое значение по формуле 


Мел=-- У, | (2.3.22) 


is 
p 


где W; — средние значения интервалов; N — количество интерва- 
Е ОТ 

Заметим, что формула (2.3.22) — это видоизмененная формула 
(2.3.20), в которой возможные результаты измерения L; заменены 
средними значениями интервалов группировки и соответственно 
частоты f; — на интервальные частоты f;. 

Вычисленное по (2.3.22) среднее арифметическое значение 


M [21 Saia — 0,407 


совпадает со значением, вычисленным ранее. Следовательно, 
распределение ошибок подравнивания определено без смещения. 
положения. | | 

Заканчивая изложение вопроса о группировке эксперимен- 
гальных данных, необходимо подчеркнуть два момента. 

Во-первых, несмотря на лучшие результаты, обеспечиваемые 
вторым способом группировки, его применение затруднительно 
тогда, когда k — число возможных неодинаковых значений изуча- 
емой случайной величины составляет сотню и более (при этом 
обычно Л’ `> 1000), а сами значения получены в результате He- 
равноточных измерений. В таком случае проще группировать 
по первому способу. Конечно, педантичный исследователь не по- 
жалеет труда, чтобы осуществить группировку данных по второму 
способу и в этих условиях, предварительно округлив более точно 
измеренные значения до наименее точно измеренных и уравняв 
таким образом измерения по точности. 

Во-вторых, несмотря на то, что в большинстве случаев пред- 
почтительней группировать данные в равные интервалы Àj, иногда 
оказывается целесообразным группировать их в неравные ин- 
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тервалы. Например, при левоасимметричном распределении более 
«мелкие» интервалы «слева», а при правоасимметричном — 
«справа» позволят точнее определить «фронт нарастания» кривой. 
_ Чрезвычайно распространено использование неравных интервалов 
при статистическом шкалировании i стр. 146). 


2.3.3. Вычисление мер положения, рассеивания, асимметрии 
и экецеееа по эмпирическому распределению 


Эмпирический ряд распределения вероятностей значений. ди- 
скретной случайной величины в качестве меры положения имеет 
лишь моду, значение которой, если она существует, непосред- 
ственно определяется по наибольшей частоте (или частости). 
В качестве меры рассеивания используется лишь размах, значе- 
ние которого определяется теперь не формулой (2.2.13), а раз- 
ностью: 


Чат. _ (2.3.23) 


где 7,„.: — последняя, а Zy —`первая границы ряда, определен- 
ные’ фактически наблюдавшимися, а не теоретически возможными 
значениями изучаемой случайной величины. Следует помнить, 
что размах полигона (d) всегда больше, чем размах гистограммы 
(4;), orp ara на тех же самых средних значениях интерва- 
лов ш; : (а, > 4,). 
ля квантованной непрерывной araia величины все pac- 

смотренные выше меры положения, рассеивания, асимметрии 
и эксцесса вычисляются по любой из эмпирических форм закона 
распределения. Но меньше всего труда затрачивается при вы- 
числениях по эмпирической дифференциальной функции, пред- 
ставленной в виде ряда средних значений равных интервалов 
группировки (W;) с сопоставленными этим значениям частостями 
(p). Именно такой формой мы ограничили получение эмпириче- 
ской функции распределения в результате группировки. Эта же 
форма, как будет показано в дальнейшем, является исходной 
для определения эмпирического, а затем и теоретического закона 
распределения в виде некоторой монотонной функции. 

За исключением моды, медианы, среднего гармонического 
и среднего геометрического значений, а также размаха все рас- 
смотренные выше меры вычисляются единообразно через так 
называемые моменты. Рассмотрим сначала исключения, а потом 
общие правила. p , 

Пример 2.3.5. B ходе, экспериментального изучения характе- 
ристик человека при слежении за целью получены эмнирическое 
распределение значений полупериодов треморовидных колебаний 
руки одного из мастеров спорта по стрельбе (табл. 2.3.15). Тре- 
буется вычислить по распределению оценки моды, медианы, 
а также среднего гармонического и среднего геометрического 
значений полупериодов ‘таких колебаний. 
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Таблица 2.3.15 


= ряд распределения значений полупериодов треморовидных 
у колебаний руки при слежении за целью. К примеру 2.3.5 


Xj — худ» мсек Wjs мсек р; FI: 15 Wir р; *15 wi 
A 
t 
47,75 0,2 35,9 0,1960 0,0055214 1,5502 0,303839 
53,25 -- 88,75 71,0 0,3260 | 0,004592 1,8513 0,603524 
88,75 = 124,25 106,5 0,1720 0,001615 2,0273 0,348696 
124,25 -- 459,75- 142,0 0,1170 | 0000824 2,1523 0,251819 
159,75 --495,25 — 177,5 0,0590 0,000332- 2,2492 0,132703 
195,25 = 230,75 213,0 0,0460 0,000216 2,3284 0,107106 - 
230,75 = 266,25 248,5 0,0280 0,000113 2,3954 0,067071 
266,25 = 301,75 284,0 0,0240 0,000084 2,4933 0,058879 
301,75 = 337,25 319,5 0,0120 0,000038 2,5044 0,030053 
337,25 = 372,75 355,0 0,0090 0,000025 2,5502 0,022952 
372,75 = 408,25 390,5 0,0065 0,000017 2,5916 0,016845 
408,25 = 443,75 426,0 0,0045 0,000011 2,6294 0,011832 
Суммы 1,0000 | 0,013388 | — 1,955319 
Примечание. À = 35,5 мсек. 


< 


Моду вычислим по формуле (2.2.2). Начало модального класса 
Хмо = 53,25 мсек. Классовый интервал А = 35,5 мсек. Частость 
модального класса р. = 0,326, частость предшествующего класса 
pı = 0,196, а частость последующего класса pg = 0,172.. 


0,326 —0,196 
s2 5 Ньоне ТЫ 
Mo = 53,25 + 35,5 ( 0,652 —0,196—0,472 


0,130 
9284 = ~ 69,51 (мсек) == 70 мсек. 


= 93,29 35,5. 
Медиану вычислим по формуле (1.4.15). Начало медиального 
класса А (0.) = 53,25 мсек. Сумма частостей предшествующих 
классов (такой всего один) Sa = 0,196. Частость, соответству- 
ющая медиане, 0,5п = 0,5. Частость медиального класса f (0,) = 
—=:0:326, 


Me = 53,25 + 35,5. (0,5 —0, 196) —*_ Е = 


—58,25 + 10792 — 53,25 1 33,4 —86,35 (мсек) ~ 86 мсек. 


Проверяя по формуле (2.4.16), убеждаемся, что Ме вычислена 
правильно: 


Me = 88,75 — 35,5 (0,5 — 0,475) 935 = 86,35 (weer) —- 


122 


Среднее гармоническое значение полупериодов колебаний вы- 
_ числим по формуле (2.2.5), заменив 2; на W; и считая, что п = 12 — 
количество интервалов группировки: 


n z 
a A 
w; ` 
= | 


Р; 
Значения отношений — —- представлены в табл. 2.3.15, там же upr- 
i 


Fi 


ведена их сумма. 


H= -zo ~ 747 (мсек) ~ 15 мсек. 

Наконец, среднее геометрическое значение вычислим по фор- 
муле (2.2.12а), снова заменяя 2, на W; и считая п = 12 количе- 
ством интервалов группировки. Промежуточные величины lg w; 
и р; № w; ложе приведены в табл. 2.3.15. Суммируя от # = 1 
до п все р; № ш в последнем столбце табл. 2.3.15, получаем: 
1,9553 — логарифм среднего геометрического. Потенцируя этот 
логарифм, находим 


С = 90,22 (мсек) == 90 мсек. 


Рассмотрим теперь с единых позиций вычисление всех осталь- 
ных мер положения, рассеивания, асимметрии и эксцесса. Для 
этого введем понятие моментов распределения. 

Для непрерывной случайной величины общая формула мо- 
мента Й-ей степени может быть записана следующим образом: 


Xmax 


Момент, = f a*f (x) dz, (2.3.24) 


min 


где k — показатель степени (порядка) момента; х — отклонение 
значений случайной величины от некоторого начала отсчета; 
Хип И Zmay — границы области определения случайной вели- 
чины 

Для квантованной непрерывной случайной величины, заменяя 
в (2.3.24) интеграл суммой, «элементы» вероятностей f (2) ах — 
вероятностями P; появления значений T; на конечных интервалах 
группировки À; и полагая, что 5, — это средние значения W; 
интервалов, получаем общую формулу моментов, которую будем 
использовать для всех расчетов при обработке экспериментальных 
данных: 


Момент, D ËP, (2.3.25) 
Е $=1 | 


где n — количество, a i = 1,2,..., N — номера интервалов груп- 
пировки. 
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Моменты различаются порядком (степенью) h и видом OTKRIO- 
нения 2;. Степень h может принимать любые значения из’ неотри- 


` Цательных целых чисел. Соответственно различают моменты нуле- 


вого, первого, второго, третьего и четвертого порядка, а также 
более высоких порядков. | 

По виду отклонения выделяют начальные, центральные, основ- 
ные и абсолютные. моменты. 

Начальные моменты определяются по отклонениям значений 
случайной величины от некоторого начала отсчета. Часто началь- 
ные моменты непосредственно вычисляют по значениям Z; слу- 
чайной величины Х, полученным в результате измерения. Эти 
значения в сущности представляют собой отклонения от нуля 
измерительной шкалы. Общая формула начальных моментов 


_ совпадает по виду с формулой (2.3.25). 


Придавая показателю степени h различные числовые 3Ha- 
чения, получим начальные моменты нулевого, первого и т. д. 
порядков. Так как эти моменты играют важнейшую роль в опре- 
делении числовых ‘характеристик случайной величины, рассмо- 
трим их подробнее. 

Нулевой начальный момент — это вероятность полной группы 
значений случайной величины: 


m= Ур =1. 


Нервый. начальный момент — это среднее арифметическое зна- 
чение (см. формулу (2. 2.7)): 


m, =) tP; =M: (2.3.26a) 


1=1 


Второй начальный момент —это квадрат среднего квадра- 
тического значения (см. формулу (2.2.9): 


m, =) 2. P;=®2. (2.3.266) 


$=1 


Третий начальный момент — это куб среднего кубического 
значения: 


m, = 5 RP; 60%. (2.3.26в) 


$=1 


Четвертый начальный момент — это ана степень сред- 


него четвертой степени: 


т, =D) uP = 04. — (2.3.26т) 
i=i 
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Нулевой начальный момент служит для проверки правиль- 
ности вычисления частостей распределения. Обычно. требуется, 
чтобы 


0,999 = УР, < 1,000. 


i= ; A 


Первый начальный момент, как неоднократно указывалось, — 
это важнейшая из мер положения распределения на числовой оси. 
Остальные начальные моменты служат для вычисления «степен- 
ных» средних и, чаще всего, для вычисления центральных MO- 
ментов. 

Формулы (2.3.2ба— -г) далеко не всегда удобны для практи- 
ческих расчетов, так как значения L; могут иметь большое коли- 
чество значащих цифр, и тогда промежуточные результаты дости- 
гают астрономических величин. Для практических расчетов по 
распределению используются другие формулы, которые полу- 
чаются из формул (2.3.2ба—г) с помощью линейного проно 
вания значений: 


х=А- zi, где 
Е | (2.3.27а). 
И 
И. (3.3.276) 


В уравнениях (2.3.27а—6) x; — это средние значения интер- 
валов группировки; À — величина интервалов, одинаковая для 
всех них; Á — так называемое условное начало, выбираемое обычно 
как среднее значение модального интервала *; zj = L — А — 
это, в сущности, тоже начальное отклонение, только от условного 
начала отсчета; наконец, 2; — начальное отклонение от услов- 
ного начала, нормированное интервалом квантования (группи- 
ровки). 

Поскольку 2; и 1; — тоже отклонения от некоторого начала, 
то по ним можно вычислять начальные моменты, которые соответ-_ 
ственно будем обозначать т» и т». Правда, величина этих момен- 
тов зависит от выбранного начала отсчета. Но легко показать, что 


М =m, =А- пи, (2.3.28а) 
где 
mı = Àm; (2.3.286). 
и где | | 
т! = = ее _ (2.3.28в) 
i=1 


* Вообще говоря, условное начало Á может быть выбрано в пределах 
£y = Xn+1, где угодно; однако, для. уменьшения расчетов его выбирают там, 
где частость меньше. 


125 


Поэтому для расчета среднего арифметического значения по рас-. 
_ пределению сначала выбирают условное начало Å, затем для всех 
средних значений интервалов х, осуществляют преобразование 
(2.3.276), после этого по формуле (2.3.28в) вычисляют M1, затем — 
по (2.3.286) — m; и далее по (2.3.28а) окончательно вычисляют М. 

Начальные моменты, начиная со второго, которые исполь- 
зуются для вычисления центральных моментов, достаточно ONPE- ` 
делить аналогичным путем: 


то = A Ms, 

Hi z (2.3.29a) 
m = 2 (131)? P; 
ms =А3тз, 

T k (2.3.296) 
m3 = 2. (z4)? P; 
ma =k M, 

=y : (2.3.2928) 


Здесь 21 = 7 — = определяется преобразованием (2.3.276). Та- 


кая возможность обусловлена тем, что величина центральных 
моментов зависит лишь от А и не зависит от начала отсчета. 
_ Центральные моменты определяются по так называемым 


о 
центральным отклонениям (х,): 


n 
0 
h 
H= È tP, (2.3.30) 
t= 
o ; ; 
где x = x; — М — центральное отклонение есть разность между 
«текущими» значениями 5х, случайной величины X и ее средним 
арифметическим значением М. > L 
о ; 
Случайная величина X, заданная центральными отклоне- 
о 
ниями Xj, называется центрированной случайной величиной. 
Процесс вычисления центральных ‘отклонений, эквивалентный 
переносу начала отсчета в точку среднего арифметического зна-’ 
чения, называют центрированием случайной величины. ` 
Нулевой центральный момент, как и все другие нулевые 
моменты, равен единице. 
Первый центральный момент теоретически равен нулю: ” 
z 
ы= À (z, —M) P, =0. (2.3.31) 
q= ; 
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Однако практически это равенство выполняется лишь прибли- 

женно из-за неточностей центрирования, в частности, из-за округ- 

ления среднего арифметического значения до величины порядка Lj- 
Второй центральный момент есть дисперсия: 


п | 
и, = № (z, —M} P;= D. (2.3.31a) 
$=1 : ` 


Однако чаще, как указывалось, ее вычисляют через начальные 
моменты: 


D = p, = m, — m? =$? — М2. _ (2.3.346) 


и наиболее часто — через преобразованные начальные моменты: 
D = p, = mg — (m4)? = X? [m3 — (т1)?].  (2.3.31s) 


Аналогично, через преобразованные начальные моменты, вычис- 
ляют третий центральный момент = 
, , £ e и” ” ” т 
Из = m3 — 3mm; + 2 (m1)? = АЗ [тз — Зтьтиа + 2 (т1)3]  (2.3.314г) 


и четвертый центральный момент 


=” 


W, =m, — Атзти + 6m, (m4)? — 3 (пи)* = 
= M [m4 — 4mm; + 6m (m4)? — 3 (т1)*, = (2.3.34) 


где значения 771 и mi определены выше формулами (2.3.286 и в), 
а значения 775 и M3, тз и тз, M, и M4 — формулами (2.3.29а—в). 
Разумеется, третий и четвертый начальные моменты можно вы- 
Числять и через обычные начальные моменты M4, То, Mg И Mys 
пользуясь теми же формулами (2.3.31г ид). 

Основные моменты определяются по основным отклонениям. 
Основными называются центральные отклонения, нормированные 
стандартными отклонениями: 


0 

Ta 

= : (2.3.32) 
где в = | VD | — стандартное отклонение. Очевидно, что основные 


моменты удобнее всего выражать через центральные моменты, 
нормированные Й-ей степенью стандартного отклонения. Han- 
больший интерес для нас представляют третий основной момент 


E = Аз Е (2.3.33) 


we 


— коэффициент асимметрии, и четвертый основной момент: 
4 — Ex — 3, (2.3.34) 
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который используется для определения коэффициента эксцесса 


Er- Aaso (2.3.34а) 


04 / 


‘ Учитывая формулы (2.3.286 и в), (2.3.29а—в) и (2.3.31г и д), 
а также то, что, как следует из (2.3.31) 


=V D =à Vm — m’, (2.3.35) 
можно записать расчетные формулы для коэффициентов асимме- 
трии и эксцесса: 

тз — 3mm; + 2 (ту)З 


Е 8 (2.3.36) 


As = 


тт — дту + 6m4 (m)? 30а _ g 
[ma (и 


где моменты My, (h = 1, 2, Зи 4) вычисляются по общей формуле 


Ех = (2.3.37) 


m i Эр (2.3.38) 


при i= 


Наконей: абсолютные моменты определяются по абсолютным 
‚ значениям (модулям) любых отклонений, начальных, центральных 
или основных. В частности, для нас представляет некоторый 
интерес первый центральный ADROO PAN момент 


ам], 
i=1 


который и называется средним арифметическим отклоне- 
нием (2.2.15). 

Наиболее часто вычисляют среднее арифметическое значение, 
дисперсию и стандартное отклонение, реже к ним добавляют 
вычисление коэффициентов асимметрии и эксцесса. Расчет всех 
этих параметров по распределению осуществляется в виде после- 
довательной процедуры, включающей преобразование (2.3.27) 
и вычисление различных моментов из числа только что рассмо- 
тренных. Эта последовательная процедура в наиболее удобной 
для вычислений форме называется способом произведений.* Pac- 
смотрим его на примере. 

Пример 2.3.6. По способу произведений вычислить для эмпири- 
ческого ряда распределения значений полупериодов треморовид- 


* Наряду со способом произведений существует и способ сумм, для 
использования которого требуются, однако, дополнительные пересчетные 


формулы. 
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ных колебаний руки при слежении за целью (пример 2.3.5) оценки 
среднего арифметического значения, дисперсии и стандартного 
отклонения, а также коэффициентов асимметрии и эксцесса. 
Исходные данные и промежуточные величины приведены 
в. табл. 2:36. Рассмотрим существо вычислительной процедуры. 


Таблица 2.3.16 


К примеру 2.3.6. Промежуточные величины к расчету М, D, с, As n Ех 
но способу произведений. Л = 35,5 мсек, А = 71 мсек 


xı (мсек) Pi =! xip; (хр; xi. (04) Pi (Ap 
| 
35,5 0,4960 | —4 |—0,1960 0,1960 — 0,1960 _ 0.1960 
71,0 0,3260 | — — -— — — 
106,5 0,4790: | >:4 0,1720 0,1720 0,1720 0,1720 
142, _ 0,1470 2 0,2340 0,4680 0,9360 1,8720 
177,5 0.0590 3 0,1770 0,5310 1,5930 47790: 
213,0 0.0460 | 4 0,1840 0,7360 2,9440 11,7760 
248,5 0.0280 5 0,1400 0,7000 3,5000 ’ 17,5000 
284.0 ’0,0240 6 0,1440 0,8640 5,1840 31,1040 
319,5 0,0120 7 |> 0.0840 0,5880 4,1160 28,8120 
355,0 0.0090 8 0.0720 0,5760 4,6080 36,8640 
390,5 0.0065 9 0.0585 0,5265 4,7385 42,6465 
426,0 0,0045 | 10` | 0,0450 0,4500 4,5000 45,0000 
Суммы 1,0000 | = | 1,1145 | 5,8075 . 32.0955 220:7215 


жди 


Моменты mo | — | mi то тз my 
Округлено A2 a~ 1260 


mi = Lul mg =œ 5,81 | тз 7 32,1 тд =œ 220,7 


1. Выберем условное начало по принципу 
А==х,, если р; (5) == тах р,, 
т.е. А = 71 мсек (табл. 2.3.146). 
” Lir 
2. Вычислим qz; = ~ z ; очевидно, что ‘при х,==А, д; = 0. 
Чтобы не писать нули, обычно строку условного начала прочер- 
кивают во всех столбцах справа, начиная от столбца 2; (см. 
табл. 2. 3. 16). Нетрудно убедиться, что при любых Zj, А и À 3Ha- 
чения 2; — это всегда натуральные числа, положительные в сто- 
рону возрастания значений Z; переменной X и отрицательные — 
в сторону убывания этих значений. Поэтому после небольшой 
тренировки значения 2; уже не вычисляют, а записывают, со- 
гласно мнемоническому правилу: а) в столбце Xi, в строке услов- 
ного начала А проставить «0» или прочерк; 6) если ряд средних 
значений 27, интервалов возрастает сверху вниз, то вверху от 
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прочерка проставить, ‚соответст венно, х, = = —1, —2, —3 ит. д., 
а внизу проставить 2; = 1,2, 3 ит. д. (см. табл. 2.3. 16). 

3. Вычислим последовательно по всем столбцам справа от 
столбца z; в каждой строке: а) Lip: 6) (21 pi) ар, в) [(2:)° pil xi 
и r) [(2:) pil z; — отсюда и название способа: «способ произ- 
ведений». Разумеется, необходимо учитывать знак отклонения 4:. 
Заметим, что последовательная процедура умножения предыду- 
щего результата на 2; выполняется столько раз, сколько пара- 
метров распределения требуется вычислить; для вычисления М 
и D — два раза, если нужен еще Аз, то — три, а если нужен 
и Ех — то, как в табл. 2.3.16, — четыре раза. 

4. Суммируем результаты последовательного умножения в че- 
тырех последних столбцах — это и есть начальные моменты ту, 
то, тз и т. соответственно. Их значения можно округлить, как 
показано в табл. 2.3.16. 

5. Вычислим` среднее арифметическое значение по формулам 
(2.3.286 иа): 

mi = Ami =35,5.1,11 ~ 39,4. (мсек), 


M = A + m4 =71- 39,4 ~ 110 (мсек). 


6. Вычислим дисперсию по формуле (2.3.31в) и стандартное 
отклонение — по формуле (2.3.35): 


= А? [m — (та)? = 35,5? . (5,84 — 1,11?) ~ 1260. (5,84 — 1,23) = 
| = 1260 - 4,58 ~ 5750,8 (мсек), 
o= VD =^ V m; — (m4) = 35,5 -2,14 ~ 76 (мсек). 


T. Висты коэффициент асимметрии по формуле (2.3.36): 


А _ m — Зи --2 (11) _ 324—3.5,81 .1.41--2(4,41)8 _ 
Ta -V m — (т) 4,58-2,14 
324—193 +25 _ 


8. Вычислим коэффициент в по формуле (2.3.37): 


py — "Ата t бт (т —3 (mi)! 3 _ 

[m — (m)?]}? 
__220/1—4.32,1. 1446. 5,81 - (1,11)? MANE 3 _ 
Е a S 

__ 220,7 — 142,5 +42,9 —46 3 _ 
= Si 3 == 2,5. 
Заметим, что последовательная процедура способа произ- 
ведений допускает использование уже полученных ранее промежу- 
точных результатов для дальнейших вычислений. Так, в ча- 
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CTHOCTH, определяя дисперсию _ И стандартное отклонение, мы 


вычислили промежуточные значения 


[m5 — (m4)?] —=4,58 и Ут — (11) = 2, 14, 


которые использовали затем при расчете Е Аз и Ех. 
Итак, искомые значения равны: 


М 0,44 сек, 0—0,08 сек, Asæ 1,56, Exæ2,5. 


Пример 2.3.7. Сопоставить оценки среднего арифметического 
значения и стандартного отклонения, вычисленные по распре- 
делениям, полученным в результате группировки по первому 
способу (табл. 2.3.8) и по второму способу (табл. 2.3.11). 

Используя способ произведений, рассчитаем ‘начальные мо- 
менты т: и M, по обоим распределениям (табл. 2.3.17). Тогда 
uo формулам (2.3.286 и а) получаем: 


M, =62 + 4 (—0,12) = 62— 0,48 = 61,52 (мм), 
М, = 61,5 +4: 0,01 =61,5 + 0,04 = 61,54 (мм), 


где М, — среднее арифметическое при использовании первого 
ЕСО группировки, и М, — среднее арифметическое при ис- 
пользовании второго способа группировки. 

Вспомним, что среднее арифметическое значение, вычисленное 
по формуле среднего взвешенного: 


: | М = 61,58 (мм). 


Можно видеть, что второй способ группировки дает значение 
арифметического среднего, более близкое к вычисленному по 
первичным данным, чем первый способ: 


М. —M<M,—M. 


Но все эти различия, в сущности, не важны, так как измерения 
(см. пример 2.3.2) амплитуды выполнялись с абсолютной ошибкой 
0,5 мм и среднее арифметическое значение с учетом точности 
измерений должно быть округлено по крайней мере до М = 
= 61,5 мм. 

Вычислим далее по формуле (2.3.35) стандартные отклонения: 


0, =41 3,05 —0,12? -=4.1,74 == 6,96 (мм), 
0.=4.] 3,00—0,01? ~4-1,73 =6,92 (mm), 


где о, и O, относятся K распределениям, полученным по первому 
и второму способам группировки, соответственно. Различие между 
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Таблица ЯН. 17 


п ромежут точные результаты вычисления М и с к примеру 2.3.7 


Первый способ группировки 


i | Pi (Sr < X<X 1) | | a тр: | (42) Pi 
42 0,0125 —5 —0,0625 0,3125 
46 GOES- —4 — 0,0600 . 0,2400 
50 0,0575 —3 — 0,1725 0,5175 
54 0,1250 —2 —0,2500 0,5000 
98 0,1700 —1 — 0,1700 0,1700 
62 0,2750 — а -- 
66 0,1775 1 0,1775 0,1775 
70 0,1025 2 0,2050 0,4100 
74 0,0550 3 0,1650 0,4950 
78 0,0025 4 0,0100 0,0400 
82 0,0075 5 0,0375 ’ -0.1875 
Суммы 1,0000 | | — | — 0,1200 | 3,0500 
Моменты то | To | mi то 
П родолжение табл. 2.8.17 
Второй способ группировки 
и, мм р; | w | "р; | (w7)2 P; 
441,5 0,010 Th —0,050 0,250 
45,5 0,015 —4 — 0,060 0,240 
49,5 0.045 —3 —0,135 . 0,405 
52.5 0,125 —2 — 0,250 0,500 
57,5 0,145 —1 —0,145 0,145 
61,5 0,290 — — — 
65,5 0,185. 1 0,185 0,185 
69,5 ‚0,140 2 0,220 0,440 
13,5 0,065 3 0,195 0,585 
PEA 0,000 4 0,000 0,000 
81,5 0. 010 5 0,050 0,250 
Суммы 1.000 | i 0,010 | 3,000 
Моменты . _ то — | mi 


Примечание. А=4 мм: Ат =562 мм; Аз = 61,5 мм. 


результатами, очевидно, несущественно, так как они могут быть 
округлены до целых: о = 7 (мм). 
Итак, несмотря на более точные результаты, которые обеспе- 


чивает второй способ группировки, при измерениях с невысокой 
степенью точности проще применять первый способ. кеты 
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$ 2.4. ВИДЫ ЗАКОНОВ. РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 


В природе существует большое разнообразие законов распре- 
‘деления, объясняемое свойствами самих случайных величин 
и условиями, в которых они подлежат изучению. = я 

Основные свойства — положение на числовой оси, рассеива- 
ние, скошенность и выпуклость, рассмотренные выше, — в общем 
случае не определяют. полностью аналитическое выражение: для 
закона распределения некоторой случайной величины. Наоборот, 
аналитическое выражение, сообразующееся как с теоретическими 
знаниями о специфике случайной величины, так и с эксперимен- 
тальными данными о ней, несет всю необходимую информацию 
о случайной величине, в том числе и об основных .ее свойствах. 

Говоря о виде закона распределения случайной величины Х, 
будем иметь в виду, во-первых, свойства самой величины X как’ 
переменной (дискретность или непрерывность и возможные Ipe- 
делы области ее существования), во-вторых, свойства реальных 
условий, влияющих так или иначе на случайную величину X, 
и, в-третьих, определенное аналитическое (геометрическое ий Ta- 
бличное) представление функций, связывающих значения х, 
случайной величины X с соответствующими вероятностями P}. 

Из большого количества видов известных законов распределе- 
ния мы рассмотрим лишь те, которые в настоящее время могут 
использоваться в психологических дисциплинах для описания 
случайных переменных. Кроме того, в главе 5 будут рассмотрены 
некоторые из специальных распределений, используемых при ста- 
тистической проверке гипотез. 


2.4.1. Нормальный закон 


Нормальный закон * распределения во всех естественных 
науках имеет фундаментальное значение. И в психологических 
дисциплинах его значение трудно переоценить. Достаточно ска- 
зать, что все психологические шкалы основываются на этом законе, 
поскольку ему следуют распределения большинства человеческих 
способностей и свойств. 

Самой общей характеристикой нормального распределения 
является простое наблюдение того закономерного факта, что очень 
большие центральные отклонения (x; — М) встречаются крайне 
редко, а маленькие — часто, 'при этом одинаковые по модулю 
отклонения одинаково вероятны. Такая закономерность может 
иметь место в условиях, когда на случайную величину Х действует 
большое число разнообразных факторов и доля воздействия каж- 
JOTO из них одинаково мала по сравнению с их числом. 


* Закон Лапласа-Гаусса (по имени ученых, независимо открывших 
и исследовавших его) из-за широкого распространения в природе перво- 
начально принимался за норму распределения любой случайной величины. 
Этим и обусловлено название «нормальный» закон. 


133 


Вероятность нормально распределенной величине Х принять 
значение 2х, на некотором интервале À определяется уравнением * 


xz; — М)? 
Pins Хы) = ye el — "|, (2.4.1) 
где М -— среднее арифметическое значение; O — стандартное OT- 
клонение; л— 3,14 ...; A= T — д ([- Ф<Х<о). 
Можно видеть, что, согласно (2.4.1), значения вероятности опре- 
деляются не только значениями аргумента Li, но и значениями М, 
о и /,.которые, естественно, различны у конкретных случайных 
величин. В этой связи целесообразно использовать вместо функ- 
ции (2.4.1) функцию плотности вероятности, центрированную 
и нормированную стандартным отклонением: 


f (2) = —— exp (—0,522), — (2:4.2) 
У2л | 
rge z= i — основные отклонения; je) = 3 Pir = Х= 
< 21.1) — плотность вероятности, как она была определена выше 
(стр. 87). 


Плотность, определяемая уравнением (2.4.2), называется стан- 

дартной плотностью нормального закона. Ее значения приведены 
в табл. I Приложения 2. 

Отметим некоторые свойства нормального распределения Ha 
примере его стандартной плотности (рис. 2.4.1, а). 

1. При всех значениях z, переменной X плотность f (x) поло- 
жительна. 

2. Плотность f (x) симметрична относительно математического 
ожидания, которое в этой связи нередко называют центром рас- 
сеивания (для симметричных распределений). Коэффициент асим- 
метрии равен нулю. | 

3. При увеличении модуля аргумента (|x| -> <>) функция f (x) 
сколь угодно близко (асимптотически) приближается к оси абс- 
цисс, не достигая ее. 

4. Максимальную плотность нормальное распределение имеет 
при в = M: 

ER 
oyn 


f (z; =M) = 


— для конкретной случайной величины и 


f(zi= M) = yr“ 


— для стандартного выражения плотности (табл. I Приложения 2). 
Таким образом, в случае нормального распределения численные 


* Запись exp (2) читается «экспонента от 2» и обозначает известную 
экспоненциальную функцию е2, где e— основание натуральных логарифмов. 
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значения среднего арифметического, мон и медианы (свойство. 2) 
совпадают. j 

5. Из рис. 2.4.1, а можно видеть, что плотность нормального 
распределения быстро убывает по мере увеличения значений 
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Рис. 2.4.1. Плотность (а) и функция распределения (6) 
нормального закона в стандартном масштабе. 


По осям абсцисс — значения случайной величины в единицах стан- 
дартного отклонения (0), по осям ординат — плотности и Bepo- 
ятности соответственно. 


центрированной случайной величины, выраженных в единицах 
стандартного отклонения, в частности, следует запомнить, что 


P (—o < X <o) ~ 0,683, 
_P(—20 < X < 20) ~0,954, (2.4.3Y 
 P{—30<X < 30) ~0,997. | 
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В этой связи и стандартное (среднее квадратическое) отклонение 
определяют по аналогии с полуинтерквартильным отклонением 
как половину величины интервала, симметричного относительно 
центра рассеивания, для которого вероятность появления на нем 
значений случайной величины Х равна 0,683. | 

6. Заметим (рис. 2.4.4, а), что при значениях —O и O на кривой 
стандартной плотности имеются точки смены кривизны (перегиба): 
на участке (—0 = X = 0) функция плотности вогнута вниз, 
а за его пределами, наоборот, вогнута вверх. 


H 


7. Четвертый основной момент: = 3; поэтому в уравнение 


для коэффициента эксцесса и Te слагаемое (—3), чтобы экс- 
цесс нормального распределения численно равнялся нулю и слу- 
ил «началом» отсчета для измерения степени крутости любых 
функций распределения. - 

Вероятность случайной величине Х принять значение не 
больше заданного х определяется функцией распределения: 


P(X <2) =F (2), 


zx; —M 
где в стандартном масштабе ( x < = 


xX 


F (2) = Е \ exp (—0,52?) dz. (2.4.3) 


Эта функция изображена на -рис. 2.4.1, 6. Так kak F (x) cmm- 
метрична относительно центра рассеивания, то при вычислениях 
используют разные другие формулы*. В частности, в табл. Г При- 
ложения 2 значения Л (x) приведены только для. положительных 
значений аргумента 


| ео ; s; 2 
г. (x) И2л. ) exp ( 0,25 ) dx, (2.4.За) 


поэтому значения F (x) при отрицательных значениях аргумента 
(— > < X = 0) следует определять по формуле 


E(t EF he), (2.4.36) 


где F (x) берется по табл. I Приложения 2 для модуля аргумента. 

Несмотря на то, что теоретически нормальный закон распре- 
деления предполагает существование бесконечно малых и беско- 
нечно больших значений любой, следующей ему случайной вели- 
чины, на практике, тем более в психологии, случайные переменные 


t См. Г. Г. А.бергауз, А. П. Тронь, Ю. Н. Копенкин, 
И. ‚169 оровина. Справочник по вероятностным расчетам. Воениздат, 
М., 1 
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имеют конечные области существования. В этой связи на практике 
используются функции нормального «распределения, ограничен- 
ные слева и справа основными отклонениями: —4 < L < 4, как 
в табл. I Приложения 2. 

Чтобы установить, является ли эмпирическое распределение 
изучаемой случайной величины нормальным, необходимо сопо- 
ставить сведения о свойствах этой величины и условиях ее изуче- 
ния, известные исследователю, со свойствами функций нормаль- 
ного распределения, рассмотренными выше. Это сопоставление 
в начале является качественным, а затем осуществляется спе- 
циальными количественными методами. Основой качественного 
сопоставления служит основное «физическое» условие появления. 
нормального распределения, а именно действие на изучаемую 
случайную величину большого числа факторов, тоже случайных, 
воздействия которых преимущественно независимы и примерно 
одинаковы. Если такое условие, по мнению исследователя, имеет 
место, то можно ожидать, что изучаемая случайная величина 
распределена нормально. Так, на формирование способностей 
человека действует множество различных случайных факторов 
(биологических, физиологических, психических и социальных). 
В этой связи можно ожидать, что в массе людей степень выражен- 
ности той или иной способности распределена нормально. И это 
во многом подтверждается практикой тестирования способностей.* 

Количественное сопоставление включает два последовательных 
этапа. Первый — сравнение отдельных свойств эмпирического 
распределения со свойствами нормального закона. Это касается 
прежде всего симметричности (мода, медиана и среднее арифме- 
тическое примерно или точно одинаковы) и эксцесса (коэффициент 
эксцесса близок нулю). Весьма информативным является факт 
наличия точек смены кривизны на сглаженном от руки полигоне 
‚ распределения при значениях случайной величины 2; = —O A 2х; = 
= 0, а также факт приближенного выполнения равенств (2.4.3). 
Если имеется соответствие между некоторыми из перечисленных 
свойств эмпирического и нормального pouipoiotonai то можно 
перейти к следующему этапу. 

Второй этап состоит в вычислении теоретической функции 
распределения по эмпирическому ряду в предположении, что он 
подчиняется нормальному закону. Именно это предположение 
и обосновывается при качественном и количественном (на первом 
этапе) сопоставлении свойств. 

Вычисление теоретических значений вероятностей, соответ- 
ствующих эмпирическим частостям, в общем случае осущест- — 
вляется либо по таблицам функций распределения, либо через. 
логарифмы, либо — с использованием таблиц специальных функ- 
ций. Нередки комбинации двух последних способов. 


* См., например, Математические методы в современной буржуазной 
социологии. «Прогресс». М., 1966. 
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В предположении нормального закона обычно пользуются 
таблицами функций f (x) или F (x). Суть вычисления вероятностей 
здесь такова. Осуществляют преобразование значений z; случай- 
ной величины Х в основные отклонения 


для чего, разумеется, предварительно следует по эмпирическому 
ряду вычислить оценки М и o. Далее по табл. I Приложения 2 


для всех х эмпирического 'ряда определяют значения стандартной. 


À 
_ плотности f (2), которые затем умножают на отношение =, чтобы 


от стандартного перейти к истинному (опытному) масштабу функ- 
ций распределения, или значению я распределения F (x): 


P; (7; = < X =) ==} (x) (2.4.4a) 


И 


Pa <=) =Р (2). (2.4.46) 


Сопоставление заканчивается сравнением фактических (получен- 
ных в опыте) ‘частостей и теоретических (вычисленных) вероят- 
ностей. Если различия малы или отсутствуют, то можно считать, 
что изучаемая случайная величина распределена нормально. 
Лишенная субъективных предпочтений оценка того, «малы» или 
«велики» получившиеся различия, осуществляется с ` помощью 
специальных критериев согласия, которые будут рассмотрены 
в главе 5. 

Если согласие теоретического распределения с эмпирическим 
рядом приемлемое, то посредством теоретических функций распре- 
деления можно Петь важные для практических приложений 
задачи: - 

— определять вероятности P (x; = X < д, + à) при любом по 
величине À; 
— определять вероятности 


P(X = 1) и (P(X > 1), < (2.4.4в)` 


где 
P(X s z)+P(X = rzr)= 1; s4 (2.4.4г) 

— определять квантили (обратная предыдущей задача): по задан- 

ной вероятности (2.4.48) определить значение z; случайной пере- 

менной X; 

— определять среднее арифметическое значение части распре- 

деления, отсекаемой ординатой ] (<). 

Пример 2.4.1. В табл. 2.3.11 приведен эмпирический ряд 
распределения значений амплитуды установившихся колебаний 
руки человека, для которого в примере 2.3.7 вычислены значения 
среднего арифметического и стандартного отклонения. Проверим, 
не является ли распределение амплитуд нормальным, и если 
является, то определим: 
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1) 2,5%-ные квантили; 75%-ный квантиль; 

2) вероятность того, что амплитуда будет больше T5 мм; 

3) вероятность того, что амплитуда колебаний руки будет 
находиться в пределах 50—70 мм; 

4) среднее арифметическое значение амплитуды при условии, 
что амплитуда будет не больше 66 mm. 

Эмпирическому ряду распределения амплитуд (см. табл. 2.3.11 
и 2.4.1) соответствует полигон распределения на рис. 2.4.2. Рас- 
сматривая ряд’ распределения и его полигон, можно видеть, что 
ряд близок симметричному. Суммарная частость значений на. 
интервале (53,5—69,5) несколько большем, чем интервал в два стан- 
дартных отклонения 20 = 2:60,92 мм, составляет 0,737, т. e. 
первое равенство (2.4.3) приближенно выполняется. Среднее 
арифметическое значение находится в том же интервале груп- 
пировки, что и мода, и (из-за симметричности) медиана. 

Конечно, амплитуда движений руки не может быть бесконечно 
малой и бесконечно большой, ` поэтому область существования 


Таблица 2.4.1 


Расчет теоретических вероятностей к примеру 2.4.1 
в предположении нормального закона 


Основные откло- 
нения х 


Частости 
Pi 


Среднее значение 
_ интервала Wi 


Стандартная 


* 
плотность f (x) Резорт» i 


0,00595 0,003 


2,9 

45,9 0,015 —2,3 0,02833 _ 0,016 
49,5 0,045 — 1,7 0,09405 ` 0,054 
535 0,125 —4,15** 0,20560 0,119 
57,9 0,145 —0,6 0,33322 0,193 
61,5 0,290 0,0 0,39894 0,231 
65,5 0,185 0,6 0,33322 0,193 
69,5 0,110 ее 0,20560 0,119 
3,9 0,065 1,7 0,09405 0,054 
11,9 0,000 23 0,02833 0,016 
81,5 0,040 2.9 0,00595 0,003 

Ii 

> 1,000 0,0 1,73324 1,001 
tai 


Примечание. 1. Проверка вычислений х и f(x} осуществляется 


выполнением равенства TÀ f (x)=~1. В нашем случае X= 4 и o= 6,92; 


о 1.73324 = 607“ А 1,002; p= — > f(z)=0, 58 f (2) OES 


формуле (2.4.4а). Разумеется, а чтобы х рег т 


Значения, отмеченные двумя звездочками, получены по табл. Г Прило- 
° жения 2 путем линейной интерполяции: f (x + 0,05) = 0,5 [f (5 + 0,4) — f (=)]. 
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š | а - 
x 


рассматриваемой случайной величины ограничена.* Тем не менее, 
уже приведенные черты сходства позволяют предполагать воз-. 
можным нормальное распределение и перейти к вычислениям. 
(второй этап сопоставления). 

Последовательность вычислений демонстрирует табл. 2.4.1. 
Сравнивая пока визуально частости р; из второго столбца 
табл. 2.4.1 и вероятности р" из последнего столбца, можно видеть, 
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Рис. 2.4.2. Полигон эмпирического ряда распределения и соответствующая 
ему дифференциальная функция нормального распределения. 


1 — полигон; 2 — дифференциальная функция; 3 — доли распределения вероятностей, 

соответствующие 2,5%-ным  квантилям; 4 — доля, соответствующая. вероятности 

P (50 мм < X < 70 мм); 5 — доля, покрывающая часть распределения, соответствующую 
| ограниченному х; = 66 мм (усеченному) распределению. 


что различия невелики. Следовательно, можно предполагать 
‚с определенными основаниями, что амплитуда колебаний руки 
распределена нормально. В частности, можно записать функцию, 
связывающую в нашем примере вероятности амплитуде принять 
° значения на интервале À = 4 со значениями амплитуды: 


ра ХА) = 9,58. 1 (2), 
rae } (5) — стандартная нормальная плотность © параметрами 
М == 61:5. и а = 6,92 (см. рис. 2.4.2). 

Определим теперь интегральную функцию. Самый простой 


способ — использование табл. I Приложения 2, непосредственно 
дающей теоретические значения вероятностей | 


РА ЕР(а ЕН) | 


Эти вероятности приведены во втором столбце табл. 2.4.2, а свя- 
зывающая их функция — на рис. 2.4.3. 

Если под рукой нет таблицы значений F (x), то значения этой 
функции приближенно определяются суммированием вероятно- 


* Минимальная амплитуда тождественно равна нулю, а максимальная 
была ограничена в опытах до 400 мм. 
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_ Габлица 2.4.2 
Вероятности значений амплитуды, не больше заданной 


wj x F (x) F* (Xh) 
41,9 2,9 0,002 0,002 
45,5 223 0,011 0,011 
49,5 =1,7 0,045 0,046 
93,5 — 1,15 0,125 0,133 
57,0 —0,6 0,274 0,288 
61,5 | 0,0 0,500 0,500 
65,5 0,6 0,726 0,712 
695 1,15 0,875 0869 
73,9 1,7 0,955 0,955 - 
11,9 pA 0,989 - 0,990 
81,5 2,9 ` 0,998 1,000 


Примечание. Табличные значения Р (5) округлены. 
Значения F* (£) получены в соответствии с формулой (2.4.5). 
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Рис. 2.4.3. Кумулятивная гистограмма F * (x;) и соответ- 
ствующая ей функция нормального распределения F (x). 
1 — гистограмма; 2 — функция; 3 — 75%-ный квантиль. 


стей P? = P (x < X < zr; + №. Но при этом следует учитывать, 
что для любого интервала Àp, среднему значению W, = Ty KOTO- 
poro сопоставляется вероятность P (X = 1,), искомое значение 
этой вероятности? 
В-1 
p” (z) =» pr- 0,5 l PESA 


i=1 
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включает только половину элемента вероятности P, приходя- 
щейся на интервал А, (рис. 2.4.3). 

Займемся теперь определением 2,5%-ных и 75%-ного кван- 
тилей распределения амплитуд. Как ‘указывалось выше ($ 1.4), 
квантилем называется значение х, случайной величины X, для 
которого вероятность 

AR SPP ЕО | (2.4.6) 


Часто вместо вероятности Œ используют процент, тогда и говорят 
о “-процентном квантиле. 

Квантили непосредственно определяют по таблице значений 
F (x), отыскивая вероятность: j 


a= Fr при а 0,5, 


Lh P 0 
или | (2.4 .ба) 
a = 1 — F (x;,) при а< 0,5, 
х,< 0, 


после чего, осуществляя -обратное преобразование аргумента 
из стандартного в естественный масштаб, определяют. 


| Та = 0G. +M. (2.4.66) 
1. Итак, 2,5%-ных квантилей два — это Lo o2 И Хоть. Опре- 
делим сначала второй. По табл. I Приложения 2 находим 


Е (2,0) =0,977 ~ 0,975. 


Основное отклонение z, = +2,0 и может служить для прибли- 
женной тощенки искомых квантилей (см. pre. 2.4.2): 


To, 025 0, 92- (— D. 61, 92 47.7 (мм), 
о уть ~ 6,92 .2-- 61,5 2275,3 (мм). 


_ Аналогично вычислим 75%-ный квантиль. Из табл. I Приложе- 
ния 2 находим F (0,7) ~0, 75, следовательно, как показано на 
рис. 2.4.3: 


толь ~ 6,92-0,7 +61,5 ~ 66,3 (мм). 


Заметим теперь, что 75%-ный квантиль — это третий квартиль 
(Оз), который мы можем вычислить по формулам (1.4.15) и (1.4.16), 
используя вероятности р} из 3 табл. 2.4.1. В частности, по формуле 
_ (1.4.15) получим 


X, 7s = 63,5 + 4 (0,750 —0,646) . ~ 66,3 (им). 


0, = 


Таким образом, пользуясь этими формулами, мы можем опре- 
делять по значениям гистограммы (полигона) любые квантили. 
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2. Если нахождение квантиля — это задача нахождения аргу- 
мента по заданному значению функции, то определение искомой 
вероятности — прямая задача, которая решается по той же та- 
®— 


_блице значений F (x), где z = и 2; — задан. Так, искомая 


вероятность 
р ХТ мм] =1—р[Х = = 75 мм] =1=Е Рав) 
=1— F (1,95). 


По табл. 1 Приложения 2, интерполируя, находим 

Е (1,95) ~ F (1,9) + 0,5 [F (2,0) — Е (1,9) =0,974. 
Следовательно, 
p[X >75 мм] = 1— 0,974 = 0,026. 


3. Вероятность того, что случайная величина X, имеющая 
плотность f (£), примет значение на конечном замкнутом интер-. 
вале (а — 6) — это определенный интеграл: 


b z 
p(a< X <b)= f {2 а, 


который для нормального закона часто называют функцией Jla- 
пласа, а в общем случае — интегралом вероятности.* Мы будем 
определять такие вероятности, пользуясь таблицей значений F (т): 


plax X<b)=F(b)—F (а) 
при (2.4.Та) 
р `>а>М иа< 6 ЗМ, 
р (а = Х = 6) = (5) -- Е ((a)]— 1 
при (2.4.76) 
b>M unu a< M, 


где М — среднее арифметическое значение. 
Искомая вероятность P (50 мм = X = 70 мм) должна быть 
вычислена по формуле (2.4.76), так как а < M:- 


рб wc xc ыы) = [e (|E r (E) 


—1 ~ [F (1,65) + Е (1,2)] — 1 ~ 0,950 + 0,885 — 1 = 0,835; 
эта вероятность показана на рис. 2.4.2. 


4. Задача определения среднего арифметического значения усе- 
ченного распределения может получить большое распространение 


* В упомянутом на стр. 136 «Справочнике по вероятностным расчетам» 
дана сводка формул, по-разному выражающих интеграл вероятности. 
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в психологической практике, в частности, при оценке средней 
успешности выполнения экспериментальных заданий в я 
пах хорошо (плохо) успевающих испытуемых.* 

Обозначая среднее арифметическое значение ‘усеченного 
в «точке» х, распределения случайной величины Х как М [Х = 
< S tl, будем использовать для расчетов формулу 


f (2) 
ET ==. M => . се 
где f(x) и F (£) — соответственно плотность и функция распре: 
| . : —M 
деления нормального закона в стандартном масштабе: х = t s 


а знак определяется тем, с какой стороны «усекается» распределе- 
ние («плюс», если слева, и «минус», если справа). Так, для х, == 66 
получаем z => 0,65. По табл. I Приложения 2 находим, интер- 


полируя: 
f (0,65) ~ 0,32273 и F (0,65) ~ 0,74189. 


Далее по формуле (2.4.8) со знаком «минус», так KAK отсекаются 
большие значения амплитуды, вычисляем: 


и ~ 61,5 —6,92. 032273 _ 
M[X = 66 мм] == 61,5— 6,92 074189 a 98,5 (мм). 


2.4.2. Нормализация по составу’ 


При измерении психических явлений одной из. важнейших 
становится задача уравнивания интервалов между значениями 1, 
случайной психической переменной X, отображенными в баллах у; 
фанжированной величины У’ (см. рис. 1.4. 2). 

Как указывалось ($ 1.4), баллы у;, линеаризуя интервалы Ах 
B Лу, маскируют возможное неравенство интервалов Ах между 
значениями 2,. Уравнять Ах, не прибегая к посредничеству бал- 
лов, можно специальными. экспериментальными методами.** Во 
многих случаях, однако, задача уравнивания проще может быть 
решена статистически. Одним из наиболее распространенных 
методов статистического уравнивания является статистическая 
нормализация. 

Суть статистической нормализации сводится к тому, чтобы 
отобразить значения у; случайной переменной У с плотностями 
вероятности f (у) в значениях 4; нормально распределенной BEIM- 
чины X с плотностями вероятности f (x), приравнивая плотности: 


F=). = (2.4.9) 


* Так, средний ГО = 115 для студентов факультета психологии ЛГУ 
(по Векслеру) — это среднее арифметическое усеченного распределения, так 
как среднее арифметическое векслеровской шкалы равно 100. 
** См. М. Рёшлен. Измерение в психологии. В сб. Экспериментальная 
психология. Под ред. П. Фресса и Ж. Пиаже. «Прогресс», М., 1966. 
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Так как у нормально распределенной случайной величины Х 


все. интервалы между основными отклонениями £ = Е 3 


выраженными в единицах стандартного отклонения, равны между. 
собой, то осуществляя приравнивание плотностей (2.4.9), мы 
фактически выражаем любые (в том числе и неравные) интер- 
валы Лу в равных интервалах Ày. Таким образом, задача стати- 
стической нормализации переменной Х состоит в том, чтобы найти 
для нее нормальные плотности вероятности f (2) *. Это можно 
осуществить в эксперименте, преобразуя переменную У B X, 
и плотности f (y) в f (2). 

Нормализация в эксперименте собтоит в том, что меняя состав 
тестовых задач (вопросов, стимулов и т. д.), подбирают такие, 
набор которых приводит к нормальному распределению вероят- 
ностей результатов (затрат времени, баллов, производительности. 
и т. д.). Это трудный путь. Обычно его не проходят до конца, 
ограничиваясь получением распределения, близкого к симметрич- 
ному, которое дальше нормализуют по составу. 

Функционально’ преобразуя изучаемую переменную У в HOP- 
мально распределенную переменную Х, подбирают вид функции. 
X = ф (У), такой, чтобы в результате как-то не по Гауссу распре-. 
деленная величина У привела бы к нормально распределен- 
ному Х. Наиболее распространенный случай — так называемое 
логарифмически нормальное распределение, имеющее плотность 


О при у; =0 
ПОЗЕ о ВЕЕТ оне 0.52 >> {2.4.46} 
| 55080. Уз exp [—0,5u*] при Y >t 
где 
‚М 
= их, = yj 
X 


Здесь функция p, преобразующая у; в 1; есть десятичный лога- 
рифм. * 

Функциональное преобразование не всегда возможно, в ча- 
стности, необходимо, чтобы преобразуемая переменная У была 
уже распределена логарифмически нормально, а это встречается 
редко. 

Наиболее простым и требующим только приблизительно сим- 
метричного исходного распределения У является путь норма- 
лизации по составу; его и рассмотрим подробнее. 


* Вероятности P (zi S X S ti НА х) В социальной психологии часто 


называют маргиналами. И задача статистической нормализации формули- 
руется как нахождение нормальных маргиналов. См. например, сб. Математи- 
ческие методы в современной буржуазной социологии. «Прогресс», М., 1966. 
** Подробнее об этом см. Справочник по вероятностным расчетам. Воен- 
издат, М., 1966. | 
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Нормализация по составу заключается в том, чтобы, пользуясь 
уравнением (2.1.7), изменять величину каждого интервала Лу 
переменной У так, чтобы его плотность стала нормальной. Про- 
цедура нормализации по составу сводится к следующему. 

_1. Выбирают «удобное» среднее арифметическое М [X], такое, 
чтобы значения x; = о [Х].х + М [Хр в свою очередь, были 
«удобными» числами, например, натуральными с [zilan = 0 
и о [Х] — тоже натуральным числом. Обычно требуется, чтобы 
o [Х] > о [У], где о [У] — предварительно экспериментально 
оценивается. 

2. По выбранным M [X], o [X] и [z;]nin строят шкалу sma- 
чений т; переменной X, все интервалы которой одинаково равны 
единице: 

2141 — fi я Ах s 1. 

‚ 3. Для переменной X по ее значениям 2; определяют нормаль- 

ную плотность: 


д = ра Ка, (2.4.11) 


где f (x) — берется по табл. I Приложения 2; 


—_ zı—M[X] 
м Бы 


4. Для нормализуемой переменной У вычисляют плотности 
вероятности (или частоты, частости), после чего значения У’, 
отстоят друг от друга тоже на равные интервалы А, = 1. 

5. Функцию плотности f (у,) центрируют в рабочей таблице 
относительно М [X], иначе говоря интервал Лу, содержащий 
оценку среднего арифметического (или моды и медианы), ставят 
в соответствие интервалу Ах, среднее значение которого Wy = 
= М [X] нормализующей переменной X. 

6. Далее в любом порядке совместно рассматривают пары 
плотностей f (у;) и f (x). Если нормализуемая плотность в а раз 
больше нормальной плотностности f (1;), то осуществляют пре- 
образование 


ед Ни) и ака, (24.128) 


т. €. плотность f (у;) уменьшают в 4 раз, и соответственно, чтобы 
вероятность не изменилась, в а раз увеличивают интервал Лу 
(см. рис. 2.4.4, аив). 

Если, наоборот, нормализуемая плотность f (у;) ва раз меньше 
нормальной плотности f (x), то ее увеличивают и соответствующий 
интервал Лу уменьшают (см. рис. 2.4.4, аиб): | 


f (2) =а} (у) и Àx Е (2.4.126) 


Так`как обычно значения 1; и у; — это натуральные числа 
(у; — обычно баллы или суммы баллов), то нормирующий пара- 
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метр а — число целое, и преобразование интервалов ir B Àx 


сводится к сдваиванию (страиванию и т. д. ) Лу, либо к их делению 
на два, три и т. д. 

Пример 2.4.2. Для одного из субтестов шкалы Векслера 
(отечественный вариант) получено. распределение предваритель- 
ных оценок (баллов) У, представленное в табл. 2.4.3. Как известно, 
шкала Векслера нормализована в целом и по субтестам. Поэтому 
необходимо нормализовать и распределение предварительных 


Рис. 2.4.4. Схема, 
поясняющая mpe- 
образование плот- 
ностей и интерва- 
лов переменной У 
при нормализации 
по ЕВ 
поэтому ПА = ря ЗЕ 
6—1 (х) = _27 
поэтому Ay = 0,54; 


в — олемент вероят- 
ности нормального 
закона; f (x) — Hop- 
мальная плотность. 
Вероятности во всех 
случаях равны: 


Ру P a 


оценок. Конечно, это следует делать на репрезентативной COBO- 
купности испытуемых. Однако принципиальное знакомство с нор- 
мализацией по составу можно осуществить и на распределении _ 


У из табл. 2.4.3. 


'4. В качестве среднего арифметического нормально распреде- 
ленной переменной X выберем М [Х] == 10, а в качестве стандарт- 
ного отклонения — 0[Х] = 3. Именно эти значения характери- 
зуют пересчетную шкалу Векслера. Минимальное значение £i 
пусть будет [zi] min = 1. 

2. Тогда основание нормализующей переменной Х определя- 
ется ее значениями T; =1,.2,3,..., 19, как показано в табл. 2.4.4, 
так как естественно ограничиться размахом нормального распре: 
деления в’ пределах -+30[Х], откуда 


[2] тах = (Инь 60 [1 = 49. 
o7 | | 1441 


Таблица 2.4.3 


Распределение предварительных оценок (баллов) 
к примеру 2.4:2 


— 


Баллы у, Частоты Частости / (у;) 
16 4. - 0,04 
19 4 0,04 
14 ; vea 0,03 
13 Г. 0,07 
12 >. 1 ieai 0,20 
11 30 0,30 
10 13 0,13 
9 14 0,14 
8 7 0,07 
7 


1 | eo Q03 


100 1,00 


м 


Примечание. Так как все А,=1, то 
плотности }(у;) тождественно равны частостям. 


3. По табл. I Приложения 2, пользуясь уравнением (2.4.11), 
определим нормальные плотности f (x;), они приведены во втором 
столбце табл. 2.4.4. Так как распределение У уже задано плот- 
ностями f(y;), то остается ее центрировать относительно M [X]. 

4. Как следует из табл. 2.4.3, модальное и медиальное зна- 
чения баллов — это у; = 11. Поэтому примем у; = 11. за центр 
рассеивания и сопоставим его М [X] = 40, поместив в. строку 
xı = 10 (табл. 2.4.4, третий столбец). 

5. Рассматривая совместно пары плотностей f(y; и f(x), 
расположенные в одинаковых строках табл. 2.4.4, замечаем, 
что минимальные (для данной выборки) * значения плотностей 


f (у; = 16) ~ f (z; = 17) 
f (Y= T) ~ f (2; = 3). 


Следовательно, можно отождествить соответственно 
(у; = 16) == (x; = 47) 


(и = 1) ==(5,=3), 


И 


и записать плотность f (у; = 16) и само значение y; = 16 в строке, - 
соответствующей z; = 17, как показано в табл. 2.4.4. 


* На большей, чем в 100 испытуемых, выборке, очевидно, можно было 
бы получить и более редкие баллы. 
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Е ; : Габлица 2.4.4 
Преобразование. плотностей и интервалов, итог - шкала, Dene баллов У 


6 значении измеряемой величины Х (к примеру 2.4.2 | 
| | Шкала. 
Преобразование Р(у;) —— F(t) u Лу — Ax пересчета 


0.0015 
0,004 
0,009 
0,018 
0,034 
0,057 
0.081 
0,107 | 
0,127 
0,133 
0,127 
0,107 
0,081 
0,057 
0,034 
0,018 
0,009 
0,004 
0,0015 


vao nton ло 


— 


Рассмотрим далее пары f(y; = 15) и f(x; = 16), f(y; = 14) 
и f(x; = 15), f (y, =13) и f(x; = 14). Можно видеть, что 


f (y: = 14) ~ Í (z; = 15) 
f Y: = 13) ~ f (x; = 14), 


XOTA в последнем случае приближение хуже, чем в первом. Для 
пары f (у; = 15) и 7(х, =16) сходства ‘нет вообще. Тем не менее, 
помня O том, что в совокупности результатов, полученных от 
100 испытуемых, значения плотности могут случайным образом 
изменяться в широких пределах (см. стр. 307), можем поставить 
в соответствие: — 


И 


(У; — 15) == (2; = 16), 

(и; = 14) = (z; = 15), 

(у: = 13) = (2, = 14), 
как это сделано в табл. 2.4.4. 
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Рассмотрим теперь тройку _ плотностей Ни, = Ее 8) и Ha AS 
f (z; = 5). Можно видеть, что 


Гу =8) == (а. =4) [ан =5). 


Это свидетельствует о том, что имеет место случай а (см. рис. 2.4.4). 
о уменьшить вдвое плотность р — 5): 


_ 0,57 (у: =8) == f (а: =4) 
0,57 (И: =8) ~ f (1, =5), 


а также увеличить, соответственно, вдвое интервал Лу, т. е. балл 
Yı = 8 должен соответствовать значениям T; = 4 и <; = 5 одно- 
временно. Результаты преобразования 0 5f (i= 9) =0,035 g 
«удвоения» Y; = 8 показаны в табл. 2.4.4 

‘Аналогично обстоит дело и с тройкой плотностей Ку, = 9). 


и f(z, = 6), f(e =): 

f (Yy: =9) ~ Í (zi = 6) + f (t: = 7), 
0,5] (y =9) = f (2, =6) 
0,57 (и; = 9) ~ f (z1 = 7), 


соответственно балл у; = 9 одновременно сопоставляется значе- 
ниям z; = би z; =Т (Табл. 2.4.4). Такое же преобразование 
OE IRET PETAOTCA для плотности f(y; = 12): 


0,57 (иг = 12) ~ f (z; = 13) 


поэтому 


И 


и 

| 0,57 (у; = 12) ~ (а = 12), 
а балл и; = 12 одновременно сопоставляется значениям T; = == 9 
ии 12. 


| Остается рассмотреть модальное значение и = 41 и хз, =, 
10, 11. Можно видеть, что 


(у: = E 


хотя приближение имеет место «с точностью до порядка». Так 
как никакая другая комбинация не проходит, остается принять: 


5 (= 14) = =9), 
Уи = 14) = Ги = 10), 


Уи) ~ Ка =). 
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Соответственно балл y; = 11 одновременно сопоставляется всем 
трем значениям: <; = 9, 10, i т.е. интервал Лу увеличивается 
втрое. 

Последняя, еще не сопоставленная пара ] (у; =10) и f(x; = 8) 
приводится в соответствие единственным образом (табл. 2.4.4). 

Преобразованная шкала значений у, = 2; однако, неудобна 
практически, так как в «растянутых» интервалах оказывается 
только по одной балльной ‘оценке, выраженной натуральным 
числом, и возникает вопрос, какому из двух (или более) x; Co- 
поставлять единственный балл Y; Если возможных исходов T; 
для балла у; число нечетное, например, 9, как в случае 


ее 
>x | 
N = 


то балл естественным образом относится к среднему из альтер- 
нативных значений 4;; в данном случае (у; = 11) == (z; = 10), 
как показано в табл. 2.4.4 (шкала пересчета). 

При двух альтернативах можно предложить следующее пра- 
вило: балл у; относится к тому значению 4;, для которого f (5;) — 
наибольшая. В результате, как это сделано в шкале пересчета, 
«спорные» баллы окончательно. сопоставлены тем значениям j, 
которые ближе к «центру рассеивания»: 


(y: =8) == (2, =5), 


(yi = 9) = (z; = 7), 
(и; = 12) = (z; = 12). 


Теперь достигнуто однозначное соответствие предварительных. 
оценок У (в баллах) и шкальных оценок X, причем неравные | 
интервалы Лу = Yi — У; путем нормализации по составу OTO- 
бражены в равных интервалах Ах= Lj — T. „Заметим, что при 
этом шкалу У пришлось «растянуть», так как её «база» в экспери-_ 


менте ‘оказалась уже, чем «базах шкалы нормализующей случай- 
ной величины Х. Рассмотрим второй пример, в котором получен- 
ную экспериментально шкалу баллов У придется, наоборот, 
«сжимать». 

Пример 2.4.3. В столбцах 1—3 табл. 2.4. 5 представлено pac- 
_пределение баллов У, полученное в результате выполнения той 
же группой в 100 человек еще одного субтеста теста Векслера. 
Сохраняя нормализующую переменную Х той же самой, что 
и в предыдущем примере, осуществим нормализацию по .составу 
и построим шкалу пересчета У в Х. Процесс преобразования 
аналогичен рассмотренному, за исключением того, что теперь 
некоторые плотности ](у;) складывают, чтобы выполнялось при- 
ближенное равенство с какими-либо из нормальных плотностей 
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Таблица 2.4.5 
Исходные данные, нормализация и ее а к PENN 2: 4. 3. 


Частота =—=—— 


5 (у) F y) JSF) у Р(х.) 


1 
2 
Prá 
6 
S9 
4 
8 
S 
6 
6 
9 
2 
7 
-2 
3 
O 
5. 
3 
1 


> NuU ARANNA 


Примечание Так как Лу =Лх=1, mo частости Р(у;) и Р(1) 


‚ тождественно равны одноименным плотностям . 


1(х;), а соответствующие интервалы уменьшают, как показано 
в табл. 2.4.5. Таким образом, здесь имеет место случай 6 (см. 
рис. 2.4.4). 

Сопоставляя плотности в столбцах 4 и 6 табл. 2.4.0, можно 
видеть, что согласие между ними более хорошее, чем в предыду- 
щем примере, хотя обследовалась одна и та же группа испыту- 
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емых. Специальное статистическое сопоставление нормализован- 
ных и нормальной плотностей будет выполнено ниже (глава 5). 
Здесь ограничимся констатацией приближенного согласия. Таким 
образом, снова случайная переменная У однозначно отображена 
значениями случайной величины X, нормально распределенной. 
Шкала пересчета образуется столбцами 5: "Я табл. 


2.4.3. Некоторые другие законы распределения, 
важные для психологии 


Гамма-распределение. Если воздействие одного или несколь- 
ких факторов из большого их числа, влияющего на случайную 
величину Х, значительно превосходит по силе воздействия все 
остальные факторы, то распределение случайной величины Х 
приобретает положительную асимметрию. Плотность вероятно- 
сти такого распределения 


Е a- же 
В TO (1—1)°-1.е-8( в) при х=ы, а>>0, В>>0 (2.4.13) 


0 в остальных случаях. 
Здесь u — произвольное число, но всегда u =Q; 


MJX]? MJX 
а и B=D (2.4.14) 


где M [X] — математическое ожидание; D[X] — дисперсия слу- 
чайной величины X; Г (%) — гамма-функция (см. табл. П Прило- 
жения 2), имя которой гамма-распределение и получило. 

Уравнение (2.4.13) представляет так называемую обобщенную 
форму гамма-распределения. При и = 0, либо при подстановке 
y = z — p получается обычное гамма-распределение с плот- 
ностью | 


Е 


f (y) a (2.4.15) 


при y = 0, “>>0, В>>0, 


0 в остальных случаях. 


Здесь обозначения те же, что в формулах (2.4.13) и (2.4.14). 
Интегральная функция гамма-распределения удовлетворяет 
уравнению 


y 
9, 
Р У = = | “-1е-Ву Ди. 
0 
Теоретические значения этой функции непосредственно не та- 
булированы и определяются обычно косвенным путем. * Для эмпи- 


* См., например, Я. Б. Шори Ф.И. Кузьмин. Таблицы для ана- 
лиза и контроля надежности. «Советское радио», М., 1968. 
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рических гистограмм значения кумуляты, характеризующие Bepo- 
ятность Р*(У = y), вычисляются аналогично тому, как это было 
показано для нормального распределения, — по формуле (2.4.5). 
Сходным образом вычисляются для гамма-распределения опенки 
‘значений интеграла вероятностей: 


Ь+0,5 А 
Р* (@а=У=5) = 2 Р* (y)— 0,5 [P* (а) + Р* (6)]. (2.4.146) 


Здесь Р*(а = У < b) — вероятность случайной величине У npu- 
нять значения на конечном отрезке <a — b`>, где аи b — сред- 
ние значения интервалов /; ^ — интервал группировки; Р* (у) — 
вероятность появления значений у на интервале À; Р* (а) иР* (b) — 
вероятности появления значений у на интервалах со средними 
значениями а и 6 соответственно. . 

_ При графическом изображении интегральной функции иско- 
мая вероятность Р* (а < У = b) для гамма-распределения, как 
и для других распределений, непосредственно «снимается» с гра- 


фика в виде 


Р*(а<У<5)=Р*(У<5) —Р*(У<а). — (2.4.47) 


Гамма-распределение находит в психологии все более широкое 
применение благодаря тому, что большинство случайных вре- 


менных интервалов, так или иначе характеризующих психиче- 
скую активность, подчиняется именно этому распределению. 
В частности, время многих реакций человека подчинено гамма- 
распределению. Ему следуют также общие (суммарные) затраты 
времени на последовательность рабочих действий, слабо зави- 
сящие (или не зависящие) друг от друга, причем величина этих 
затрат для разных действий может значительно варьировать, 
согласно условию, сформулированному выше. 

Пример 2.4.4. Человек-оператор, взаимодействуя с одной 
из подсистем обслуживаемой им системы контроля и управления, 
вынолняет разнообразные действия: включение и выключение 
подсистемы, настройку и переключение рабочих режимов и др. 
Путем хронометража в натурных условиях получены оценки 
общих затрат времени на действия операторов с указанной под- 
системой, которые в зависимости от числа и специфики действий 
варьируют от нескольких секунд до нескольких минут. Эмпири- 


ческий ряд распределения этих затрат времени приведен в Nep- 


вом и втором столбцах табл. 2.4.6. Поскольку длительность не- 
которых действий человека с подсистемой значительно превышает 
длительность большинства остальных, можно ожидать, что слу- 
чайные затраты рабочего времени подчиняются гамма-распре- 
делению. Об этом же может свидетельствовать и скошенность 
ряда распределения влево (положительная асимметрия). 
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ий 
ия $ 


р* (t) Aa 3,16 ° 1075 . #8. е-5,3*107°8.$ 


Таблица 2.4.6 
Расчет вероятностей по;гамма-распределению затрат времени: 


t, сек p (t) lg t 3 lgt _ 0,023 lg р* (t) p* (1) 
12 0,016 1,0792 3,2376 0,2760 — 1,5387 0,029 
36 0,216 1.5563 4,6689 0,8280 - —0,6594 0,219 
60 0,278 1,7782 5,3346 1,3800 —0,5457 0,285 
84 0,236 1,9243 5,7729 1,9320 — 0,6594 0,219 

108 0,129 2,0334 6,1002 2,4840 — 0,88414 0,134 

132 0,070 2,1206 6,3618 3,0360 —1,1745 | 0067 

156 0,035 2,1934 6,5793 3,5880 — 14,5090 0,031 

180 0,015 2,2553 6,7659 4,1400 — 1,8744 0,012 

204 0.005 2,3096 6,9288 4.6920 —2,2635 0.005 

228 0,005 2,3579 7.0737 5,2440 —2.6706 0,002 


Примечание. Логарифмируя функцию вероятности гамма-распре- 
деления получаем: lg р* (1) = lg (3,16 . 10-5) --3 lg t—5,3 . 10-2 1 e =—4,5008-- 
-+ 312 — 0,023. Следовательно, каждое значение lg р* (#) в шестом столбце, 


таблицы получено суммированием чисел в четвертом и пятом столбцах, 
и константы —4,5003. 


Так как минимальные затраты времени асимптотически стре- 
мятся к нулю *, примем исходной для расчета двухпараметриче- 
скую (2.4.15) форму гамма-распределения, согласно которой 
вероятность затрат времени: | 
ABe 
Г (œ) 
где À = 24 cek — интервал группировки; T — рабочее время; 
ti — среднее значение затрат времени на Гтом интервале À. 

Вычислив по методу произведений среднее арифметическое 


M [X] = 76,7 сек 
и дисперсию затрат времени 
DIX F= 1425 сек?, 
определим по формуле (2.4.14) значения параметров & и В: 


6 
НЕ — 4,13. 


Учитывая, что при целых & Г (<) = (% — 1)!, округлим @& = 4, 
очевидно, без большой потери точности; 
76,7 


p= = 0,053 (=). 


р*(&=Т < ti +A) = T T (2.4.18) 


* Например, отдельный взгляд на средства контроля может длиться 
десятые доли секунды, что по сравнению с интервалом группировки А = 
— 24 сек является ‘исчезающе малой величиной. | 
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Заметим, что параметр В в отличие от & имеет размерность ско- 
рости и характеризует интенсивность (производительность) дей- 
ствий человека-оператора. Подставляя найденные значения пара- 
метров & и В, а также À в формулу (2.4.16) и обозначая для крат- 
кости искомую вероятность p*ž(t < T < ti + Л) = р*(0, nony- 
чаем уравнение 


p* (t) = 24 Gao 27$ . {36-53 1072: t, 


Осуществляя преобразования коэффициента при неизвестном: 


AEA E 5 316407, 


Puc. 2.4.5. Гамма-распре- 
деление вероятностей 06- 
щих затрат времени к 
примеру 2.4.4. 
По оси абсцисс — время 
t, сек; по оси. ординат — Be- 
роятности Р* (t), крестиками 
обозначены частости P(t). 


6-36 ад 38. _ 180... 228 


окончательно получаем расчетное уравнение 
р* (#’=3,146-1075 — 13е-5,3-10-*-1, 


Вычисление вероятностей по этому уравнению проще всего осу- 
ществляется через логарифмы, как показано в табл. 2.4.6. Co- 
поставляя частости р (t) с вероятностями р* (t), — столбцы -`2 и 7, 
в табл. 2.4.6, — можно убедиться в неплохом согласии резуль- 
татов. Гамма-распределение вероятностей общих затрат времени 
показано на рис. 2.4.5. 

Определим далее, пользуясь формулой (2.4.5) и столбцом 7 
табл. 2.4.6, значения кумуляты р*(Т = t), они приведены 
в Табл. 2.4.7. Заметим, что значения кумуляты, соответствующие 
средним значениям интервалов, определяются по формуле (2.4.5), 
а соответствующие граничным значениям — по формуле (1.4.11). 
Можно, конечно, ограничиться одним из способов, но тогда ока- 
жется затрудненным практическое использование кумуляты для 
определения вероятности р*(Т = t) при любом t == w; или t + gj. 
Кумулята, представленная удвоенным числом значений р* (T < t), 
_как в табл. 2.4.7, может быть легко сглажена от руки на графике. 

Сглаженная кумулята (рис. 2.4. 6) является хорошим при- 
ближением к истинной интегральной функции и позволяет не- 
посредственно с графика определять интересующие исследователя 
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jæ 


Таблица 2.4.7 


Вычисление значений кумуляты по значениям вероятностей 
из табл. 2.4.6 (7-й столбец) 


m e R зип иво 


t, сек. p* (T < w;). p* (T <&;) p* (T < t) 

0 _0,000 0,000 
12Х 0,014 | 0,014 
24 0,029 0,029 
36x | 0.439 | и 
48 0,248 0,248 
60% l 0,390 0,390 
72 ; 0,533 0,533 
84% 0,643 . 0,643 
96 0,752 0,752 
108% _ 0,848 0,818 
120 0,883 0,883 
132 0,917 0,917 
Ahh _ 0,950 0,950 
156 0966 0,966 
168 0,981 0,984 
180 0,987 _ 0,987 
192 0,993 _ 0,993 
204 0,996 0,996 
216. 0,998 0,998 
228 0,999 _ 0,999 
240 | 1,000 _ 1,000 


Примечание. «Крестиками» (Х) отмечены средние 
«значения W; интервалов группировки; оны зна- 
чения интервалов. | 


10 zæ AmA 


Рис. 2.4.6. Интегральная ae / 
функция гамма-распре- / 
деления вероятностей за- 4 
трат времени, получен- дб 7 
ная по данным примера 
2.4.4 сглаживанием от 
руки кумуляты, значе- / 
ния которой представ- 04 g 
лены в табл. 2.4.7 m 060- 
значены — «крестиками» 7 

на рисунке. х 
По оси абециес — время, 02 / 


сек, по оси ординат — веро- 
ятности Р* (Т< | 


0 36 04 132 180 28 


оценки вероятностей. Например, по рис. 2.4.6 легко опре- 
делить, что вероятность затрат времени на действия с подсистемой 
не более минуты составляет почти 0,4, а вероятность затрат вре- 
мени в пределах одной-двух минут по формуле (2.4.17) составляет 


р* (60 < T < 120) = р* (T < 120) —р* (T < 60) = 
~ 0,885 —0,385 = 0,5, 


т. е. половина всех затрат времени на обслуживание лежит в этих 
пределах. 

Комбинации трех параметров (œ, В, u) обеспечивают значи- 
тельное разнообразие кривых, в которых реализуется гамма- 
распределение. При больших % гамма-распределение приближа- 
ется к симметричному, почти нормальному виду (например, уже 
при © = 10). Наоборот, при % = 1 гамма-распределение крайне 
асимметрично (модой является у = 0). 

Частным случаем гамма-распределения, при % = 1, является 
так называемое экспоненциальное распределение. 

Экспоненциальное распределение. Оно имеет плотность 


_ [ Ве-® при 20, В>0, | 
ra=] О в остальных случаях. | +19) 
Здесь В => и M [X] — математическое ожидание, а D [X] Dn 


дисперсия случайной величины X. 
_ Интегральная функция экспоненциального распределения 
определяется как 

Е (1) =1—е-*, (2.4.20) 


а интеграл вероятности равен 
Р(а=Х<ь=Р(Ь)—Е(а) =e —е8%®. (2.4.21) 
b>a 


Для эмпирического ряда показателем того, что его распреде- 
ление экспоненциальное, служит, помимо крайней асимметрии 
частостей, равенство среднего арифметического значения и стан- 
дартного отклонения а 


M[X] =0 [X]; (2.4.22) 


Наиболее широко экспоненциальный закон распределения 
используется в психологических приложениях теории надежности 
и теории массового обслуживания. В частности, ему следует 
распределение времени между различными ошибочными дей- 
ствиями человека, выполняющего некоторую работу. В этой 
связи параметр В называют интенсивностью отказов (ошибок) 
человека. 
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Пример 2.4.5. В экспериментах по изучению надежности 
элементарных вычислительных операций, выполняемых чело- 
веком, установлено, что при сложении чисел интенсивность OMM- 
бок, остающихся незамеченными и приводящих к неверному 


1 $ 
результату, составляет 0,42. = И остается постоянной в те- 


чение 10 минут вычислений *. Считая, что распределение вре- 
мени между ошибками (t) экспоненциально, можем записать: о 


f (t) =0,42е-0,421 
F (t) =1—е 9,421. 


Чтобы воспользоваться этими формулами для вычисления вероят- 
ностей, требуются таблицы функций е*, либо — логарифмов. 
Логарифмируя плотность, получаем: | 


lg f (t) = 1g 0,424 0,42 lg et = —0,3768 — 0,42 - 0,4343t. 


Например, требуется определить вероятность TOTO, что Ha HMH- `~ 

тервале 1 + 0,02 мин появится незамеченная ошибка. Так как 

А = 1, то 
бт 1 = 0,02) ~ f (t), 

lg f (t) = — 0,3768 — 0,1824 = — 0,5592. 


Потенцируя, определяем /{(1) = 0,276. = 

Пусть далее требуется оценить вероятность того, что скрытая 
ошибка появится `не позже, чем через 1 мин после начала сло- 
жения. Преобразуя интегральную функцию, логарифмируем ее: 


lg [1— F (t)] = — В lg e = —0,43438; 
и подставляем Es GA i ted: 
Ig [1— F (t = 1)]=—0,4343 -0,42 1 > —0,1824= 1,8176, откуда 
antilg (1,8176) = 1 — F (t = 1) = 0,658, 
следовательно, искомая вероятность 


p(T =1 мин) =F (1=1 мин) =1 — 0,658 = . 0,342. 


Биномиальное распределение. Пусть выполняется п незави- 
симых испытаний, в каждом из которых может появиться неко- 


‘торое случайное событие А, безусловная вероятность появления 


которого постоянна и равна Р, а вероятность его непоявления 
равна 1 — P.  НОследонНтеЛЕНОСТЬ событий, образованная таким 
образом, называется последовательностью Бернулли; она pac- 
сматривалась выше. 


* H. М. Кандарацкова, Г. В. Суходольский. 06 эф- 
фективности и надежности элементарных вычислительных операций. В cô.: 


Экспериментальная и прикладная психология, вып. 1. Изд. ЛГУ, 1968. 
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A и с - 

Вероятность Р‚„ и того, что в последовательности Бернулли 

длиной в N испытаний некоторое событие А появится ровно т 

раз, равна коэффициенту при неизвестном х” в разложении 
бинома [prz + (1 — Ре по степеням д: 


Ребра Руа wA Nh an) 


E] 
AEE R число сочетаний из N элементов по M. 
ЕО ожидание числа благоприятных исходов (т) 


определяется величиной 
М [m] =пР, 
а дисперсия — произведением 
D [m] = nP (4 — P). 


Учитывая, что M — натуральное число, или нуль, очевидно, следует 
округлять значения обоих параметров до целой части: * 


М [m] = ant {nP} (2.4.22a) 


D [m] =ant {aP (1—Р)}. ` (2.4.226) 


В психологической практике биномиальное распределение 
используется всегда, когда требуется определить априорную 
вероятность появления изучаемого события в серии независимых 
испытаний известной длины. В частности, известные попытки 
«доказать» существование телепатической связи основываются 


на сравнении вероятности ответов перцепиента с априорной вероят-. 


ностью случайного угадывания, вычисляемой по биномиальному 
распределению. Аналогичное сравнение проводится в исследова- 
ниях обнаружения пороговых стимулов и вообще там, где тре- 
‘буется установить зависимость (или независимость) возможности 
появления какого-либо события от определенных факторов. 
Пусть, например, имеется алфавит (полная. группа) из де- 
сяти событий А, (i = 1, 2, ..., 10), причем вероятность одного 
из них, события А., составляет 0,1. Очевидно, вероятность He- 
появления этого события (что эквивалентно появлению любого 
из остальных девяти событий) равна 0,9. Определим, считая по- 
явление событий в последовательности испытаний независимым, 


* Принято считать биномиальный закон — распределением существэнно 
дискретной переменной, что, очевидно, связано с его преимущественным 
использованием в схеме Бернулли. Но биномиальное распределение можно 
использовать и для любых неотрицательных п и т (при т < п), заменяя 
факториалы первого сомножителя на гамма-функции: / 


4S Г (® 1) n-m 
ПИР Ta Tam И 


где параметры m и n могут иметь смысл времени. 
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вероятности Р„ m событию А. появиться. ровно т раз из п, где 
м = ар = т. 2, . .10: 


} 


о и .0,4°.0,910 —=1.1.0,91 ~ 0,35, 

Род = 0,1 -0,99 —240.0,4. 0,387 = 0,39. 

Рио = вт 0,12-0,98 ~ 45 -0,01 -0,43 ~ 0,19, 

Pioa = zir 01°- 0,97 ~ 120 -0,001-0,478 ~ 0,06, | 
Pia 101 0,14-0,9 ~ 240 - 0,0001 - 0,531 ~ 0,01, 
E 0! 0,45 -0,98 ~ 252- 0,00001 - 0,59 ~ 0,002, 
Pire В 0,4°.0,91 ~ 210- 0,000001 - 0,656 ~ 0,0004. 


Можно видеть, что вероятность независимого последователь- 
ного появления в серии из 10 испытаний одного из десяти событий, 
имеющего фиксированную вероятность осуществления 0,1, быстро _ 
уменьшается, так что уже шестикратное появление А. можно 
практически рассматривать как событие невозможное. Если бы 
теперь в некоторых условиях, от опыта к опыту, событие А. 
появлялось бы более чем 6 раз из 10 испытаний, то это свидетель- 
ствовало бы о том, что появление Аз зависит от условий опыта, 
и схема Бернулли неадекватна. 

Различные комбинации значений параметров п и т приводят 
к большому разнообразию форм биномиального распределения. 
При n < 20 асимметрия распределения обычно ярко выражена; 
она положительна при р < 0,5, отрицательна при р » 0,5; при 
р = 0,5 распределение симметрично. При n >> 20 биномиальное 
распределение для любых, но не очень малых Р симметрично 
и асимптотически приближается к нормальному с параметрами 


М[Х| = nP и 0*[Х] =пР (1 —Р). 


41 г. в. Суходольский 


Глава 8 


КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ ДВУМЕРНОЙ 
СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН 


$ 34. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ В СИСТЕМЕ ИЗ ДВУХ СЛУЧАЙНЫХ 
ВЕЛИЧИН | | 


3.1.1. Система из двух случайных величин i 


Две случайные величины, рассматриваемые вместе, образуют 
систему. Пусть случайная величина Х задана совокупностью 
своих значений z, (i =1,2,..., n), а случайная величина У — 
совокупностью значений у; (j =1,2,..., n). Каждую из слу- 
чайных величин можно изобразить совокупностью точек на чис- 
ловой оси, как делали раньше. Но две случайные величины, 
рассматриваемые вместе, условимся изображать на двух взаимно- 
перпендикулярных осях — горизонтальной оси Х и вертикальной 
оси У. Тогда событие, состоящее в совместном появлении какой- 
либо пары значений Ly; этих величин изображается на плоскости. 
в системе прямоугольных координат точкой А;,. Так как величины 
X и У случайным образом принимают свои значения, то появление 
любой пары значений ху, — это случайное событие. Поэтому 
точка А;, случайным образом располагается на плоскости XOY 
и называется случайной точкой. Следовательно, множеству из N 
пар значений 2}/, случайных величин X и У соответствует M 
случайных точек на плоскости ХОУ (рис. 3.1.1, а). 


——> 
Соединяя точку А;; с началом координат, получим вектор OA; j, 
длина и направление которого случайны (см. рис. 3.1.1, 6). Io- 
этому систему из двух случайных величин называют случайным 
вектором на плоскости. А так как плоскость имеет два измере- 
ния, то говорят о двумерной системе случайных величин. 
Совместное рассмотрение двух случайных величин в психоло- 
гических приложениях может означать, во-первых, их принад- 
лежность одному и тому же индивиду, во-вторых, одновременную 
принадлежность совокупности индивидов и, в-третьих, принад- 
лежность этих величин совокупности индивидов, рассматрива- 
емой в течение двух различных периодов времени. Так, попарное 
изучение возрастных особенностей психических качеств лич- 
ности приводит к тому, что на протяжении длительного исследо- 
вания у одного и того же индивида для каждой парыХ и У опре- 
деляется совокупность числовых значений z; (i =1,2,..., n) 
u y; (j =1,2,..., п), которые характеризуют возрастные уровни 
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ты 


проявления изучаемых качеств личности. Например, раз в полу- 


годие, на протяжении всего периода дошкольного, школьного 
и вузовского обучения (a 20 лет) у индивида измеряются объем 


`‘непосредственного запоминания (Х) и объем внимания (У). Тогда 


обе случайные величины Х и У оказываются заданными сорока 
парами значений T;yj. 

Попарное изучение психических качеств людей может осу- 
ществляться на протяжении сравнительно небольшого периода 
времени у группы людей, числом п. В результате снова для 5 
бой пары качеств, измеримой в виде случайных величин XF, 
получается совокупность из N пар значений Ly j. 


а 6 


Ti — X Ti 


Рис. 3.1.1. Случайная точка (а) и случайный вектор (6), изобра- 
жающие систему из двух случайных величин X и У. 


К двумерной системе случайных величин приводит также 
изучение у группы из п людей одного и того же психического 
явления (количественно определяемого в виде случайной вели- 
чины), но измеряемого в течение двух равных периодов времени - 
или, что то же самое, при двух разных комплексах условий. 

Случайные величины в системе характеризуются теми же 
свойствами, что и отдельная случайная величина. Это — положе- 
ние и рассеивание значений на числовой оси, а также скошенность 
и крутость. Однако свойства системы не исчерпываются свойст- 
вами образующих ее величин. В системе появляются новые свой- 
ства: ее положение и рассеивание на плоскости (рис. 3.1.2), ее 
асимметрия и крутость, а также связь между отдельными CHY- 
чайными величинами. Таким образом, количественные характе- 
ристики двумерной системы должны охватывать как систему 
в целом, так и отдельные составляющие ее случайные величины. 

Все количественные характеристики в двумерной системе, 
так же как и для одной случайной величины, принято делить 
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на функции распределения и на числовые характеристики, яв- 
ляющиеся параметрами функций распределения. 

Двумерная система случайных величин характеризуется тремя 
видами законов распределения: 

1) законом совместного распределения вероятностей значений 
ту; случайных величин X n Y и закон распределения,, 
закон pecupogptens «на плоскости»); 


у | = yg 4 


Рис. 3.1.2. Положение и рассеивание в системе из двух случайных величин 
о. RA 


Совокупности случайных точек схематически изображают возможные различия этих 

свойств: а — система расположена в квадранте ПТ; б — система расположена в ква- 

дранте Т; рассеивание значений здесь больше, чем в ‘случае а, так как точки занимают 
ббльшую площадь. 


2) двумя безусловными законами распределения, соответст- 
венно — величины Х и величины У; 

3) совокупностью условных законов распределения вероят- 
ностей значений одной из случайных величин, при условии, что 
другая приняла фиксированное (конкретное) значение. 


3.1.2. Закон совместного распределения двух случайных 
величин | 


Полной количественной характеристикой двумерной системы 
является закон совместного распределения вероятностей значений. 
ту; случайных величин X и У. 

_ Если X и У — дискретные. переменные, то вероятность COB- 
местного появления пары значений 2, — обозначим ее P (x;y;) 
— может быть изображена в виде перпендикуляра, восстановлен- 
ного в точке плоскости XOY, имеющей координаты (x;y;). Высота 
перпендикуляра равна Р(х.у;). Совокупность таких вероятностей, . 
сопоставленная совокупности возможных пар значений дискрет- 
ных случайных величин, образует закон совместного распределе- 
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ния этих величин в форме, аналогичной дифференциальной функции 
распределения. Здесь вероятности Р(х,у;) могут быть подробнее 


записаны так: 
P (ty) = PX = z) (У =y), 


где (X = z;) (Y = y;)— конъюнкция событий, состоящих в том, что 
дискретные величины Х и У приняли р значения 2, 
и yj. 

Другая форма закона совместного распределения. двух MMC- 
кретных случайных величин (аналогичная интегральной функции), 
задается совокупностью вероятностей 


РЕХ = 2) (У = y;)l, 


сопоставленных всевозможным парам значений этих величин: 


№ 9-х 
Ряд и аРИХ 20 ФИ, (3.1.1) 


где суммирование выполняется для всех X = д, иУ <y. Считая, 
что совокупность всех возможных пар значений ту, образует 
полную группу, очевидно, имеем: 


$S PIE ==) (= и EREA 
поэтому. | 


= Р[(Х = 1) (У = У;)] = 1. 


‚ Обе формы закона совместного распределения вероятностей 
‘могут быть заданы таблицей (см. табл. 3.1.1) и графически (см. 
рис. 3.1.3), а также аналитически в виде формулы. 

l Таблица 3.1.1. 


В пояенение понятия закона совместного распределения 
двух дискретных случайных величин Хи У 


P [(X =«;) (У=у;)] | PRE SAT < gj) 


значения Xi величины X s значения Хх; величины y y 
51 | 2 | 3 1 | 2 3 
| 

=> 4. 1.10 | 0.10 0.13 0,10 0,20 = .0,33 
ха 7 
= 5 2 0,416 0,07 Го ю | ор Не в | 0%. 0.66 
pi |= i ; 
T = 
о в | 3 0,07 0,16 Г 0.10 0,33 0.66 | 0,99 


Примечание. Для простоты мы ограничились тем, что случайные 
величины Х и У принимают только тр значения (1, 2 и 3), вероятности 
которых произвольно заданы. 


_ 165 


- 
_ Для квантованных непрерывных случайных величин X и Y, 

‚ принимающих значения на интервалах Ах и Лу соответственно, 
можем рассматривать вероятность P [(z; < X < r; + àx) x 
X (Y; = Y < y; + ^,)| совместного появления пары значений £; Yj 
на прямоугольном участке площади со сторонами Ày m Ày. Эта 


l A 


Рис. 3.1.3. Пространственные столби- Рис. 3.1.4. Призмограмма (a) и Ky- 
ковые диаграммы, изображающие —мулятивная призмограмма (6, верти- 
вероятности, приведенные в табл. кальный масштаб уменьшен вдвое), 
3.1.4. соответствующие вероятности в таб- 
= a—P |(X=x;) (Y=y;)] лице 3.1.2. PIE 
и 0—Р[(Х <х,) (У <y;)]. Масштаб.б no — 
вертикали уменьшен вдвое. 


вероятность геометрически может быть определена объемом пря- 
моугольной призмы с высотой f (£,;y;) и основанием Ах Ày: 


P (а = Хз Ах) (у, = У = и-^у)| = Py = f (ziy) Axhy. 
| | ` (3.1.3) 


Совокупность таких вероятностей (P;;), сопоставленная совокуп- 
ности пар интервалов АхЛу, образует закон совместного распреде- 
ления вероятностей значений Ty; квантованных непрерывных 
случайных величин Х и У и геометрически изображается в виде 
призмограммы; (рис. 3.1.4, а). 


166 


Суммируя вероятности (3. т 3) по д; и по у, определяем вероят- 
ность совместного выполнения неравенств А=а и У=у: 


РКХ ==) (У = и - ХХ Ри. _ 84.4) 


Очевидно, как и для дискретной величины: 


где n — количество. интервалов квантования Ах и Ày. 
Совокупность вероятностей (3.1.4), сопоставленная совокуп-` 
ности пар интервалов АхЛу, образует «интегральную» форму закона 
распределения; геометрически она определяется в _ виде кумуля- 
тивной призмограммы (рис. 9:1.4, 
Значения вероятностей (3.1.3) и (3. 4. 4), по которым построены 
призмограммы на рис. 3.1.4, приведены в табл. 3.1.2. 


Таблица 3.1.2 


Значения вероятностей, по которым построены призмограммы 
а) Вероятности Ру=РИх<Х<х-РАХ) (у<У<у,Р^у)1 призмограммы (рис. 3.1.4а) 


х<Х <; РА, 
ЯР, ЕР, 
0,5-1,5 | 1,5-2,5 | 2,5-3,5 | 11 

D 0,5 -= 1,5 0,10 | 0,10 0,13 0,33 
AS A 
у 1,5 +2,5 | 0,16 0,07 0,10 | 0,33 
5 
V e 
S 2,5 +3,5 0,07 0,46 | 0,10 0,33 
n 

Ур ВН 0,33 0,33 0,33 

]=1 


6) Вероятности P[(X <x) (У<у;)] кумулятивной призмограммы 
(рис. 3.1.46) 


ci 
| а 2 | 3 
5 1 | 0.10 | 0,20 0,33 
V 
a 22 a aeea 08 
3 | 0,33 | 0.66 | 0,99 
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Величина f (x;y;) в уравнении (3.1.3) называется двумерной 
плотностью вероятности. Она характеризует как бы «массу» веро- 
ятности, приходящейся на «единичный» прямоугольный «элемент» 
площади XOY, и численно равна высоте элементарной призмы 


ххх g 
PSSS 


Рис. 3.1.5. Геометрическая интерпретация 
` функции двумерного распределения. 

а — заштрихована площадь фигуры, удовлетво- 
ряющая > совместному решению неравенств 
(ES х;) и Ди = Yj); 6 — объем пространства, 


изображающий вероятность P [(X < x) (У < у]= 
=F (x, y), согласно уравнению (3.1.6), гдехи 
у — координаты точки А. 


Интегрируя плотность f (x, у) похи 


ную) фуницию двумерного распределения: 


с "x 


Xmin min’ 
где 


Е (z, и Fi 


на призмограмме (рис. 

3.1.4. 1). . | 
Если рассматривать 

бесконечно малые . значе- 


‘ния интервалов квантова- 


ния 4х и dy, то вероят- 
ность непрерывным слу-. 
чайным величинам Х иУ 
принять значения на эле- 
ментарном прямоугольни- 
ке площадью ах.АУу запи- 


-сывается так: _ 


P [(2= Х< 2-42) x 
o Хх (= Х<уа] = 
— f(z, у)ахау, (3.1.5) 


где] (£, у) — теоретическая 
функция двумерной naom- 
ности, ах > 0 и ау>0. 
Функция двумерной плот- 
ности геометрически пред- 
ставляет собой некоторую 
поверхность, рельеф кото- 
рой может быть любым 
(так же, как и рельеф 
местности): Наиболее изу- 
ченными являются выпук- 
лые симметричные функ- 
ции двумерной плотности, 
подчиняющиеся закону 
Гаусса. | 

по у, получают (интеграль- 


у) ах dy, < (3.41.6) 


Рура (<. 


Геометрически F (x, у) — это объем 


пространства, ограничен- 


ного сверху поверхностью распределения f (x, y), а снизу — пло- 
щадью фигуры, образованной совместно выполняемыми неравен- 
ствами Х «хи У < у (см. рис. 3.1.5). 


168 


оф 


- 3.1.3. Безуеловные и условные законы распределения 


Интегрируя двумерную плотность вероятности по переменной 
У, получаем безусловную плотность распределения случайной , 
величины Х: i 


Ym ax 


t= f fæ y)dy 


Ymin 


которая характеризует X при всех возможных (Ymin + Ymax) 

значениях случайной величины У. 
Практически, оперируя с эмпирическими плотностями и ча- 

стостями (вероятностями), осуществляют суммирование 


(2;) = 2 Í (iyi) Ày 


И 
p [ziS X S tit hl =È p (2< X< t t Aa) (S Y S< țy H o)l, 
ge , 


что коротко будем записывать так: 


р:= № Ри, `°_ (3.4.7а) 


TeL 


где р; — безусловная частость (вероятность) случайной величине X 
принять значение на интервале Ах (при всех значениях вели- 
чины У); Ри— частости появления всевозможных значений 
y; (=1,2,..., п) совместно со значением Ñ; (i — фикоировано). 
Аналогично. определяются: 

— теоретическая безусловная плотность распределения пере- 
менной У при всех значениях переменной X (от Lmin ДО нах) 


X 


= f еда; 


—эмпирическая плотность 


| f (Y;) =A f (21y i) Ax; 


— безусловная частость (вероятность) 


plys У = и М = Хр (а: = Х = Ti+ À) (и; = У=зи-АЬ 
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что коротко будем записывать так:. 


ты в: 2-76) 
i=1 
где p;— безусловная частость Е случайной величине 
У принять. значения на интервале ^, (при всех значениях вели- 
чины X); pı; — определена выше. 

Совокупность частостей (вероятностей) р,, сопоставленная 
совокупности интервалов À,, на которых случайная величина X 
принимает свои значения Li, образует эмпирический ряд безуслов- 
ного распределения вероятностей случайной величины Х в дву- 
мерной системе. Точно также, совокупность частостей (вероят- 
ностей) pj, сопоставленная совокупности интервалов Ày ‚ образует 
эмпирический ряд безусловного распределения вероятностей слу- 
чайной величины У в той же системе. Оба ряда представлены, 
например, в последних строке и столбце табл. 3.1.2а. 

Кроме совместного и безусловных распределений в двумерной 
системе существуют так называемые условные распределения. 
Эти распределения образованы. условными вероятностями появ- 
ления значений одной из величин, при условии, что другая вели- 
чина приняла значение на каком- -либо из своих интервалов кван- 
тования. 

Как и для аа событий, вероятность совместного ‘появ- 
ления пары значений ху, определяется произведением безуслов- 
ной вероятности появления одного из значений на условную веро- 
ятность другого значения при условии, что первое появилось: 


P (T:y;) = P (z,); P CHER, =P (y;) P (z:/Y;) 


P; =P; P (jli) =P; -P (i/i), Tie 28.48) 


rae P,; =P (у;) — вероятность совместного появления любой 
пары значений на элементе площади со сторонами Ах и Лу; 
ры РВ (2,) и Р,=Р (у;) — безусловные вероятности появления 
значений д; на. интервале Àx и у, на интервале À, соответственно; 
P (ij) = P (z;/y;) n: P (7/7) =Р (ylz) — условные. вероятности ве- 
личине X принять значение T; на Ах при условии, что величина У 
приняла значение у; на Лу, и величине У принять значение у; 
на Лу при условии, что величина X приняла значение х, на 
Ày соответственно. 

Совокупность условных вероятностей. (частостей), сопостав- 
ленная совокупности интервалов À одной случайной величины, 
соответствующих некоторому интервалу значений другой случайной 
величины, образует ряд условного распределения вероятностей. 

Каждая из случайных величин в двумерной - системе имеет 
столько условных распределений, на сколько интервалов А кван- 
тована другая случайная величина. Чаще всего обе величины кван- 
тованы на одинаковое количество п интервалов À. Тогда всего 
в двумерной системе насчитывается 2п условных распределений. 


170 


или короче: 


3.1.4. Взаимосвязь случайных величин в двумерной системе 


‚ Из уравнения (3.1.8) следует, что условные вероятности опре- 
деляются отношениями 


Pij 
P (ilj) = F ;  (3.4.9a) 


P di) —- a (3.4.96) 


Обобщая (3.1.8) и (3.1.9a, 6), можем написать уравнения, связы- 
вающие плотности вероятностей: 


f (æ, y) =f (2): f 2) = f (Y): На) 


откуда 
АЖ (z, у). 
ful =A и Де =. 
Аналогичные равенства можно записать и для Е распреде- 


ления: 
Е (£, y) =F (2). F (у/2) =F (y): F (21), 


F 
F (yj = FEV n Fap R. 


откуда 


Учитывая уравнения. (3.1.7а, 6), можно, действительно, YT- 
верждать, что двумерная плотность вероятности полностью оп- 
ределяет количественно систему двух случайных величин, так 
как из нее можно определить и безусловные, и все условные плот- 
ности. Но чтобы получить двумерную плотность, необходимо 
знать безусловную плотность вероятности одной из случайных 
величин и все условные плотности другой случайной величины. 
Это практически важный вывод, так как всегда можно организо- 
вать экспериментально-психологическое исследование таким об- 
разом, чтобы регистрировались совместные появления пар зна- 
чений изучаемых психических переменных. Основываясь на ус- 
ловиях зависимости и независимости случайных событий, можно 
сформулировать такие условия и для случайных величин Х и У 
в системе. 

Условия независимости случайных величин Х и У, рассмат- 
риваемых совместно, заключаются в том, что выполняются сле- 
дующие равенства: 


7(2/у) = f (x) при любых наблюдаемых у, 
| f (y/x) = f (у) при любых наблюдаемых х. (3.1.10а) 
Или, для вероятностей: | 
P (ijj) =P; при всех j,} . 
P (j/i)=P; при всех i. | (3.1.106) 
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Случайные величины Х и У взаимозависимы, если хотя бы 
для одного из значений одной случайной величины условная плот- 
ность отличается от безусловной плотности. 

Поясним соотношения плотностей распределений в двумер- 
ной системе и условия независимости несложным примером. 
_В табл. 3.1.3 представлены вероятности совместного появления’ 


Таблица 3.1.3 


В пояснение соотношений между плотностями вероятностей 
в двумерной системе . 


3 
Yj sy | №1 Àe Às | aT E] 
Ài 0,06 0,10 0,04 0,2 
№ 0,15 0,25 0,10 0,5 
i 0.09 0,15 0,06 0,3 
3 
УР —Р; 0,3 0,5 0,2 1,0 


Р;; и безусловные вероятности P, и P; для величин X и У, кван- 
тованных на 3 интервала каждая. Используя равенства (3.1.Эа 
и 6), вычислим условные вероятности P (1/] u P (j/i), как noka- 
зано в табл. 3.1.4. 
Таблица 8.1.4 
Условные распределения в системе (X, У} 


Y j o Ài À2 Às 
0. = О — 0,04 
« бт а г 9 
1. 0,06 0,10 004 22. 
03 мы 05 ==0.2 05 — 0,2 
615 - 9,2557 810. = 
à 0,5 a 0,5 eia 0,5 Sa 
£ 0,15 0,25 0:40... 
03: >= 0,9 0,5 ENP 0,2 TS 
0,09 _ TA PO 0,06 
í 0,3 =a Ti - 95 0,3 т 
3 0,09 0.15 0,06 _ 
жи. TE РЯ 
Примечание. В прямоугольниках: сверху — условные вероятности 
£ a=, внизу — условные вероятности P И) =. 
i i 
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Сравнивая ряд распределения безусловных вероятностей в. 
записанных в последней строке табл. 3.1.3, с рядами распределе- 
ния условных вероятностей P (1/7), записанных сверху в каждой 
строке табл. 3.1.4, можем убедиться, что 


Pi =P {H для всех ]. 
Также убеждаемся в том, что. 


Р,=Р (7/1) для всех $, 
т. е. случайные величины Х и У стохастически независимы. 


$ 3.2. ХАРАКТЕРИСТИКИ ПОЛОЖЕНИЯ, РАССЕИВАНИЯ И СВЯЗИ 


Каждое из распределений, имеющих место в двумерной си- 
стеме, характеризуется теми же общими свойствами, что и распре- 
деление одной случайной величины. Однако чаще всего исполь- 
зуют симметричные двумерные распределения, нормальные, либо 
близкие нормальному. И по этой причине рассматривают преиму- 
‚ чцественно характеристики положения, рассеивания и связи между 
величинами. Характеристики положения и рассеивания делятся 
на числовые и функциональные. 


3.2.1. Чиеловые характеристики положения и рассеивания 


В качестве числовых характеристик (мер) положения исполь- 
зуются главным образом средние арифметические значения. | 

Положение совместного распределения на плоскости ХОУ 
характеризуется точкой с координатами (М [X], М [У)]), где 
М [X] — безусловное среднее арифметическое значение, харак- 
теризующее положение безусловного распределения случайной 
величины X на числовой оси 2-0в; М [У] — безусловное среднее 
‚арифметическое значение, характеризующее положение безуслов- 
ного распределения случайной величины У на числовой оси- 
1/-ов. В дальнейшем для краткости будем называть M [X] — без- 
условным средним от Х, а М [У] — безусловным средним от У. 

Положение условного распределения s/y; на плоскости XOY 
характеризуется точкой с координатами (М [2/уй, у;), где у; — 
фиксированное значение случайной величины У, относительно 
которого рассматривается условное распределение величины X; 
М [z/y;] — условное среднее арифметическое значение величины X 
при фиксированном значении у; (сокращенно: условное среднее 


«Х по у»). р 
Положение условного распределения у/т; на плоскости Sd 
также определяется точкой с координатами (x М [9/1], где 


т, — фиксированное значение случайной величины X , относитель- 
_ но которого рассматривается условное распределение величины У, 
М [9/=,] — условное среднее арифметическое значение случайной 
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величины У при фиксированном значении Tj. Это условное сред- 
нее «У по z и определяет положение условного распределения 
относительно оси у-ов. 


Условных средних М [z/y;] и М [y/z;] в двумерной системе 


столько же, сколько условных распределений рассматривается. 

Безусловные и условные средние арифметические значения 
аналитически определяются по тем же «понятийным» формулам, 
которые были рассмотрены для’ отдельной случайной величины. 
Расчетные формулы будут даны ниже. В качестве числовых ха- 
рактеристик (мер) рассеивания для каждого из рассмотренных 
распределений преимущественно используются дисперсии и стан- 
дартные отклонения. 

Рассеивание двумерного распределения характеризуется двумя 
дисперсиями и соответственно двумя стандартными отклонениями: 


D[X] и o[X]=V DIX], 
О [У] и o[¥]=V DIY], 


где Р [Х] — безусловная (общая) дисперсия случайной величины 
X при всех значениях величины (У); с [Х]— безусловное cran- 
дартное отклонение случайной величины X; D [У] — безуслов- 
ная (общая) дисперсия случайной величины У (при всех значе- 
ниях величины X); о [У] — безусловное стандартное отклонение У. 

Рассеивание ‘любого условного распределения характеризу- 
ется условной пи и условным стандартным отклонением. 
Будем обозначать, D [z/y;] — (условную) дисперсию условного 
распределения х/у;, о [х/у;| = Ур [2/у;|— соответствующее cran- 
дартное отклонение П[у/х;] — (условную) диснерсию условного 
распределения y/xz; в [У/х;] =V D [y/x;] — соответствующее стан- 
дартное отклонение. 

Безусловные и условные дисперсии аналитически определяются 
теми же «понятийными» формулами, что и дисперсия отдельной 
_ случайной величины. Расчетные формулы рассмотрим ниже. 


5.2.2. Простые регрессии 


Функцию, связывающую какой-нибудь ‘параметр условных 


распределений одной случайной величины со значениями другой 
случайной величины, будем называть (простой) регрессией. В дву- 
мерной системе различают регрессии «У на X» и регрессии «X на У». 

Обычно рассматривают только параметр положения — ус- 
ловные средние арифметические значения одной величины в функ- 
ции от значений другой. Тогда регрессия «У на X» (или у/1;) — 
это геометрическое место условных средних  М[у/х;|, соответст- 
вующих значениям 2;, которые принимает случайная величина X 
на интервалах квантования Ах (рис. 3.2.1,a). Будем обовначать 
эту регрессию ух =\ (5;). Другая регрессия — ху=ф (у;) — это 
геометрическое — условных средних М [2/у; |, соответствующих 
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значениям Yj, которые случайная величина У принимает на своих 
интервалах квантования Лу. = | 
В психологических исследованиях, наряду с регрессиями 
условных средних, существенное значение могут иметь регрессии 
других параметров условных законов распределения: дисперсий, 


а 


Рис. 3.2.1. Простые регрессии. 
а— нелинейная регрессия. Заштрихованы условные плотности вероятности } (у/х;). 
Крестиками на плоскости XOY обозначены условные средние М (у/х;); соединяющая 
их кривая (жирный пунктир)—это нелинейная регрессия Y = Ņ (х); d [M (41%;)] = 
размах распределения условных средних М (у/х;); а[У]—размах безусловного pac- 


пределения У; б— линейная регрессия. Заштрихованы условные плотности вероятности 
f (X/Y 1): Точками на плоскости ХОУ обозначены условные средние М (х/у;); соеди- 


няющая их пунктирная прямая—это линия регрессии х,=Ф (у); а [M (х/у ;)]` Размах 
распределения условных` средних М (х/у;); а[Х]—размах безусловного распределе- 
) 
ния X. 


Е: 


стандартных отклонений и размахов, коэффициентов асимметрии 
и т. д. Например, для условных стандартных отклонений это бу- 
дут регрессии = ! 

o [y/x] = (2;) и в [z/y;] = ọ (y;). 


Здесь в общем виде рассмотрим простую регрессию u = & (2), 
в которой и — некоторый параметр одной из случайных величин. 
(условное среднее, условная дисперсия, стандартное ` отклонение 
и т. д.); 2 — значения другой случайной величины в рассматри- 
ваемой системе, а. & — функция, устанавливающая соответствие 
между Z как независимой и и как зависимой переменными. 


U 


Рис. 3.2.2. Геометрическая 
интерпретация линии рег- 
рессии и = az +- ð. 

1 — случай, когда а > 0, но 
b < 0; 2 — случай, корда а<0, 
но 6 > 0. 


0 


По виду функции & все регрессии подразделяются на два 
класса: линейных и нелинейных регрессий. 

Линейная регрессия в системе прямоугольных координат 
ZOU имеет вид прямой линии (рис. 3.2.2) и описывается уравне- 
нием 


и аа, ‚ (3.2.1) 


‘где b — свободный член, характеризующий значение и при yc- 
ловии 2 = 0 (см. рис. 3.2.2); а — (угловой) коэффициент pez- 
рессии, характеризующий скорость изменения переменной w 
в зависимости от изменения аргумента Z. 

Жоэффициент регрессии численно равен тангенсу угла наклона: 
_% линии регрессии относительно оси аргумента: 


аще. (3.2.2} 
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где Аи = Un — и; — изменение зависимой переменной и соот- 
ветствующее ÂZ = Z; — Z; — изменению аргумента 2; a =Q 
при 0 = а < 90° na < 0приа >> 90°, как показано на рис. 3. 2, 2; 

Нелинейные perpeccum могут быть любой криволинейной 
формы: монотонные — возрастающие или убывающие, периоди- 
ческие — простые и сложные. 

Монотонные нелинейные регрессии во многих случаях могут 
быть аналитически выражены некоторой комбинацией членов 
полинома (параболы) й-ей степени: 

и=а,-- а,2-- а... - а,_12'-1 1 az}, (3.2.3) 
где h принимает целочисленные значения от 0 до любого наперед 
заданного N; а, — коэффициенты полинома — любые действитель- 
_ ные числа. 

Нетрудно видеть, что при k = 0; 1 и всех а,>:== 0, полином 
1-й степени — это прямая линия (и = âo + 4&2), которая, таким 
образом, является частным случаем нелинейной регрессии. При 
h= 0; 12а м ве ar>a = 0 имеем А параболу (и = а, 
+ 4:2 £ aaz’). 

Расширяя область значений показателя степени h до всех 
действительных, отличных от нуля, чисел и используя замену 
переменных, можем из полинома (3.2.3) получить ряд других, 
важных для психологических приложений функций: 
—степенную и=а,2' при й > 0; 

—гиперболу и=а, 2" =} или U= a+ ap 2"; 
— показательную U = Qh”, где h— константа; M, в частности, экс- 
потенциальную: 

U = а,е?®, 


где h== e — основание натуральных `логарифмов, константа 
b — действительное число; | 

— логарифмическую и = а, log 0 + ap, где z= log 0.— nora- 
рифм (по любому основанию) нового аргумента 9 (в частном слу- 
чае а, = 0). 

Простые периодические функции — это обычно sin Z, 608 Z 
а также tg 2 и Ctg Z, которые находят свое применение при aHa- 
лизе амплитудно-частотных характеристик и при изучении мо- 
торной активности человека в разных отраслях психологии и фи- 
зиологии труда и спорта. 

Чаще, однако, встречаются сложные периодические функции, 
которые представляют собой комбинации (суммы и/или произве- 
дения) периодических и монотонных функций. В качестве примера 
можно привести следующие pome. 

«Затухающий синус» (по Ф. Кликсу) *: 


Dz; = Kei. sin (Wt -+ Фо), 


 *Ф. Кликс. Проблемы психофизики восприятия ре: 
«Прогресс», М., 1965, стр. 136. 
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где Dr — зависящее от времени (t) положение феноменального 
пространственного направления; А и а — константы, зависящие 
OT условий опыта; © — круговая частота колебаний; фу — фазо- 
вый сдвиг, обусловленный запаздыванием реакции анализатор- 
_ных систем. человеческого организма. 

_«Затухающий косинус», широко используемый при корреля- 
ционном анализе случайных психических и физиологических 
процессов,* а также процессов поведения человека-оператора при 
слежении,** 


R (t) = Ае-о 1. | соз Въ 


где А (т) — корреляционная функция (см. стр. 256), зависящая 
от т; т — интервал времени, в течение которого существует связь 
между значениями исследуемого процесса; В — круговая частота; 
A n & — масштабные параметры. 

Комбинация косинуса и параболы, характеризующая диспер- 
сию (и) эффективности восприятия некоторых заглавных букв 
человеком в зависимости от средней эффективности (2) т. е. рег- 
рессия дисперсии на среднее арифметическое: *** 


| и =a (2 — 1,5): (26 — 2) 
при | 


а = 0,07 + 0,038 . cos (13,852), вед, 


3.2.3. Корреляция и ее свойства 


Согласно условиям (3.1.10а и 6), случайные величины Хи Y 
независимы в стохастическом (вероятностном) смысле лишь тогда, 
когда все условные законы распределения тождественно равны 
безусловным. В противном случае величины Х и У считаются 
стохастически связанными. Таким образом, в общем случае сто- 
хастическая связь имеется тогда, когда каждому из значений од- 
ной случайной величины соответствует специфическое (условное) 
распределение вероятностей значений другой величины, и наобо- 
рот, каждому из значений этой другой величины соответствует 
специфическое. (условное) раерредоленио вероятностей значений 
первой случайной величины. 


* Г. А. Сергеев, Л. П. Павлова, А. Ф. Романенко. 
Статистические методы исследования электроэнцефалограммы человека. 
«Наука», 1968. 

** Г. А. Сергеев, Г. В. Суходольский, В. М. Водло- 
зеров. Исследование статистических характеристик человека-оператора 
при нестационарных входных воздействиях. В сб.: Система «человек и авто- 
мат». «Наука», М., 1965. 

оды ЗЫ Е ОК ОА x одольский. К проблеме надежности человека. В сб. 
Вопросы инженерной психологии в автоматизированных системах управле-_ 
ния. Ji., 1972. 
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Специфичность условных распределений по сравнению с о д- 
ноименными» безусловными распределениями может состоять: 
— только в отличии условных средних от безусловных, 

— только в отличии условных дисперсий от безусловных, 

— в отличии коэффициентов асимметрии (или эксцесса) условных 
распределений от этих КозОинарнтОв безусловного распределе- 
НИЯ, 

 — в сочетании перечисленных отличий. _ 

Частным случаем стохастической связи является корреляция. 

Корреляция состоит в том, что условные средние каждой 
случайной величины отличаются от «своих» безусловных средних, 
а по этой причине, как будет показано, и условные дисперсии от- 
личаются от безусловных дисперсий. Из такого определения кор- 
реляции следует, что наличие корреляции не исчерпывает воз- 
можных видов стохастической связи (зависимости) между двумя 
случайными величинами, а отсутствие корреляции не означает 
еще отсутствия других проявлений зависимости. Лишь для дву- 
 мерного нормального распределения стохастическая связь HMC- 
черпывается корреляцией. . 

Можно выделить четыре основных свойства корреляции: 
направленность, тесноту, форму и направление. 

Направленность, как и в случае сопряженности, характери- 
зует одностороннюю обусловленность изменения значений одной 
из случайных величин изменениями значений другой случайной 
величины. В общем случае возможна как односторонняя направ- 
ленность: X обусловлено У’, но не наоборот, или У обусловлено X, 
но не наоборот, так и двусторонняя (взаимная) направленность: 
Х обусловливает У, а У обусловливает Х. В частном случае 
двумерного нормального распределения корреляция всегда вза- 
имна. Но при этом могут оказаться различными степени корреля- 
ции. В этой связи будем различать корреляцию х по у (5/1) Koppe- 
ляцию у пох (у/1). 

Теснота (сила, высота и т. п.) корреляции — это степень 
обусловленности изменений Х значениями У или, наоборот, У 
значениями X. Поскольку эта обусловленность проявляется в OT- 
личии условных средних от «своих» безусловных средних, то тес- 
нота корреляции (7/у) характеризуется степенью отличия услов- 
ных средних М [5/у,| от М [X], а теснота корреляции (y/x) харак- 
теризуется степенью отличия условных средних М [у/х;| от 

Форма корреляции определяется линейностью или нелиней- 
ностью регрессий М [9/5] = (7) и М [z/y] = ọ (У). Соответ-. 
ственно принято различать линейную и нелинейную корреляцию. 
_ Линейной корреляция является тогда, когда обе регрессии линей- 
ны. Если хотя бы одна из регрессий нелинейна, то и корреляция 
является нелинейной. Иногда нелинейностями регрессий можно 
пренебречь. Тогда их приближенно заменяют прямыми линиями 
и корреляцию считают квазилинейной. Следует подчеркнуть, 
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Рис. 3.2.3. Свойства линейной корреляции. 


а — корреляция отсутствует. Слабая корреляция: б — положительная; 

в — отрицательная. Сильная корреляция: г — положительная; д — отри- 

цательная. Полная корреляция (функциональная связь): е — положи- 

тельная; ж — отрицательная. Везде: М [У] им EX] — безусловные сред- 
ние; М [у/х] и М [х/у] — регрессии условных средних. 


что в психологической практике чаще встречаются нелинейная 
и квазилинейная корреляции. | = 

Направление корреляции выражается направлением регрес- 
сии. Если регрессия есть возрастающая функция своего аргу- 
мента (а > 0), то направление считают положительным (см. 
рис. 3.2.3, 6, в, 2). Если регрессия есть убывающая функция 
своего аргумента (а < 0), то направление считают отрицатель- 
‚ным (см. рис. 3.2.3, д, e, He). | 


3.2.4. Меры корреляции 


Универсальной мерой тесноты связи является коэффициент 
детерминации, который представляет собой отношение дисперсии 
условных средних к безусловной дисперсии. 

На рис. 3.2.1 можно видеть, что общий размах безусловного 
распределения каждой случайной величины есть сумма | 


d[Y]=d [M (у/2,)1 + do [у/=й 
d [X] =d [M (2/у;)] + do [z/y;ls 


где а [М (y/x;)|— размах, характеризующий рассеивание услов- 
ных средних М (у/2;); а [М (2/у;)] — размах, характеризующий 
рассеивание условных средних М (x/y;); do [у/т/. — часть общего 
размаха случайной величины У, определяемая рассеиванием 
условных распределений у/1;; do[z/y;|— часть общего размаха 
случайной величины Х, определяемая рассеиванием условных 
распределений £/y;. | 

Если вместо размаха воспользоваться более точной мерой рас- 
сеивания — дисперсией, то можно записать аналогичные равен- 
ства‘и для дисперсий: 


DIY] =D [М (y/z;)] + В. [y/zi, | 
D [X] = D [M (z/y;)] + Ds [2/y;]; 


где D [У] и D [X] — безусловные дисперсии; D [М (y/z)] и 
D [М (z/y;) | — дисперсии условных средних относительно «своих» 
безусловных средних, Do [у/2;] и Do [5/у; |— средние из условных 
дисперсий. * Все эти дисперсии вычисляются различными спосо- 
бами, которые рассматриваются ниже. Здесь ограничимся «поня- 
тийными» формулами для дисперсий условных средних: 


И 


(3.2.4) 


n 


DIM (y/%)1= È {M (y/z)—M [Y]}?; P; 


Š (3.2.5) 
D [M (2/у;)] = >à [M (2/9) —M [X]}*- P; 


=1 


* При этом предполагается, что условные дисперсии D [у/х;] не зависят 
от X, а условные дисперсии D [х/у;] не зависят от У. 
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и для средних из условных дисперсий: 


D, (yz = 2 D [у/21.Рь 


- Ee (3.2.6) 
D, [z/y;] JA D [z/y;l: Pj» 
j= CERUA 
где i= 1,2,..., п — номера условных распределений y/£;; 
j =1,2,..., п — номера условных распределений х/у;; P, и 


P; — безусловные вероятности для X и У, остальные обозна- 
чения введены выше. | 

Из уравнений (3.2.4) после простых преобразований следуют 
формулы, определяющие в общем виде коэффициент детерминации 
величины У величиной Х: 


DIM i D i 
o i= A РИ (3.2.7a) 
и коэффициент детерминации величины Х величиной У: 
D [М (z/y;)] Do [z/v;] > 
usnm А: (3.2.76) 


Таким образом, коэффициенты детерминации показывают относи- 

тельную долю отличия условных средних от безусловных, причем 

мерой отличия являются дисперсии условных средних. 
Анализируя уравнения (3.2.7a и 6), можно видеть, что 


0 = ns 1, | 
О = Nku = 4. 


(3.2.8) 


_ Следовательно, максимально тесная корреляция имеет место 
тогда, когда вся безусловная дисперсия исчерпывается дисперсией 
условных средних. Например, 


D [М (9/57 =D [У], 


как показано для линейного случая на рис. 3.2.3, е и ж. Здесь 
мы имеем дело с частным случаем стохастической связи — с функ- 
циональной зависимостью. Заметим, что при функциональной 
зависимости обе регрессии сливаются в одну и оба коэффициента 
детерминации оказываются равными единице. 

Наоборот, корреляция отсутствует, если вся безусловная дис- 
персия исчерпывается средним из условных дисперсий, например, 


О, [У/хИ Е D [y], i 
как показано на рис. 3.2.3 а. Поскольку по смыслу отношения 


Do [y/zxi] = Do [z/y;] 
S, DIYA D [X] 
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противоположны коэффициентам детерминации, их иногда исполь- 
зуют как меры необусловленности изменений средних одной 
случайной величины изменениями другой и называют коэффици- 
ентами акорреляции (индетерминации). Коэффициент акорре- 
ляции, таким образом, показывает долю изменчивости, обуслов- 
ленную посторонними факторами, которые находятся за преде- 
лами рассматриваемой двумерной системы Х и У. 

Наряду. с коэффициентами детерминации для измерения тес- 
ноты однонаправленной связи применяются корреляционные от- 
ношения: 


Пу/х A Ут», 
Ney = И. 


Распространенными мерами тесноты и направления линейной 
взаимной связи являются ковариация и коэффициент корреля- 
ЦИИ. | 
Ковариация (СОУ) — это среднее произведение цент- 
ральных отклонений: 


(3.2.9) 


CONV == 55 У’ (1— М [Х) (у, — М[У)-Р,,, (3.2.10) 
Е = 

где P; — вероятности (частости) совместного появления пар 
значений 21у,. 

Важно понять и запомнить основные свойства кони 
как меры тесноты и направления корреляции. 

” 1. Ковариация случайной величины самой с собой есть диспер- 
сия: 


СОУ [ХХ] = р [Хр (8.2.14) 


СОУ [УУ1=Ь [У]. 


‚2. Ковариация максимальна по абсолютной величине и равна 
дисперсии D [Х] = D [У] при функциональной зависимости, 
‚ когда прямая у = ах + b располагается к оси абсцисс под 

углом 45 или 135° (см. рис. 3.2.3, e n xe). 

3. Ковариация по абсолютной величине равна нулю при гори- 
зонтальном расположении линии регрессии у/х; и вертикальном 
расположении линии регрессии х/у; (рис. 3.2.3, а), а также стре- 
мится к нулю при нелинейной регрессии параболического вида 
(как на рис 3.2.1, а). Таким образом, модуль ковариации заключен 
в пределах: 


0=|<0У|= DIX]=D[Y]. (3.2.146) 


4. Ковариация положительна при положительной и отрица- 
тельна при отрицательной корреляции. Знак ковариации опреде- 
ляется тем, что при положительной связи все центральные откло- 
нения в формуле (3.2.10) положительны (см. рис. 3.2.3, 6, 2, e), 
а при отрицательной связи положительное центральное отклоне- 
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ние одной величины всегда умножается на отрицательное цент- 
ральное отклонение другой величины (см. рис. 3.2.3, в, д, xe). 
° Коэффициент (линейной) корреляции (г) можно определить 
несколькими способами. 

Во-первых, при строго линейной корреляции, теоретически 
связь полностью взаимна, в результате 


n =n, =r?, (3.2.42а) 


откуда получается, что | | 


Практически, однако, всегда имеются отличия эмпирических 
регрессий от линейных, и равенства (3.2.12а и 6) не выполняются. 
Но коэффициент корреляции всегда меньше хотя бы одного из кор- 
реляционных отношений. 

Во-вторых, можно определить коэффициент корреляции как 
ковариацию, нормированную произведением стандартных откло- 
нений: 


À 


(6102 


При этом, учитывая свойства ковариации, запомним: 
—1 == и 0=|г|=<14 


т. е. знак коэффициента корреляции характеризует направление 
связи, а модуль |г| — ее тесноту. 

В-третьих, можно определить коэффициент корреляции как 
среднее геометрическое из коэффициентов регрессии: 


г = ajja ах, (3.2.14) 


где ау/— угловой коэффициент прямой ` регрессии у/х и ах/у — 
угловой коэффициент прямой регрессии s/y. ^ 
Из уравнений (3.2.13) и (3.2.14) нетрудно определить: 


| o pnr- _СОУ_ 
И 
o 6 [Х] COV 


В-четвертых, из этих равенств следует, что коэффициент KOP- 
реляции — это стандартизованный коэффициент регрессии: 


Хх Y 
ra ay E = aa ТТ. _ (3.2.46) 


На практике для вычисления г используются преимущественно 
последние три способа, а первый служит для проверки степени 


184 


отличия регрессий от линейных, а также для оценки доли взаимо- 
влияния переменных по сравнению с долями их одностороннего 
влияния. В этой связи заметим, что взаимная линейная корреля- 
°ция двух случайных величин может быть на самом деле обуслов- 
лена влиянием на эти величины некоторой другой неизвестной 
величины (или нескольких величин, см. главу 7). 


$ 3.3. ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВЕННЫХ ХАРАКТЕРИСТИК 
ДВУМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН 
ПО ДАННЫМ ЭКСПЕРИМЕНТА 


3.3.1. Аппроксимация проетой регрессии 


Одной из важнейших задач при обработке данных психологи- 
ческого эксперимента является аппроксимация регрессий. Аппрок- 
симация регрессии означает приближенное аналитическое (фор- 
мульное) выражение регрессии по ряду пар значений и; и z (i = 
= 1, 2, ..., п), полученных в эксперименте. Благодаря amann- 
тическому выражению, во-первых, становится возможной интер- 
поляция, т. е. определение значений исследуемой величины, не 
изучавшихся экспериментально, а во-вторых, и это главное, науч- 
ные законы приобретают законченную математическую форму- 
лировку. 

Можно выделить три этапа аппроксимации простой регрессии: 
выбор функции Ë, вычисление неизвестных коэффициентов, 
(стр. 186), проверка удовлетворительности аппроксимации опыт- 
ных данных функцией &. 

1. Выбор аппроксимирующей функции во многом определяется 
знаниями и навыками исследователя и представляет из себя своего 
рода искусство. 

_ Могут быть два гипотетических основания для выбора функции 
Е определенного вида. Первое — это априорные сведения о законе, 
которому подчиняется изучаемая величина (или аналогичные ве-. 
личины). Например, латентный период времени реакции для боль- 
шинства разновидностей реакций подчиняется закону Ньерона 
(закону силы), что аналитически выражается гиперболой;* интен- 
сивность ощущений следует либо закону Вебера — Фехнера (ло- 
гарифмическая функция), либо закону Стивенса (степенная функ- 
ция) **. Второе основание — это вид сглаженной (выравненной) 
от руки кривой на графике, где в координатах ZOU обозначены 
эмпирические значения и; (см. рис. 3.2.2). 

Гипотезу о том, что выбранная функция пригодна для аппрок- 

симации целесообразно попытаться проверить, прежде чем пере- 


* См. B. D. Ломов. Человек и техника. «Советское радио», 
‚ 1966, стр. 43; Е. И. Бойко. Время реакции человека. —«Меди- 
цина», 1964; Р. 'Шошоль. Время реакции. В сб. Экспериментальная пси- 
хология. Под ред. П. Фресса и Ж. Пиаже. «Прогресс», 1966. 

** А. Пьерон. Психофизика. Там же. ` 
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ходить к вычислению неизвестных коэффициентов. Простейший 
способ проверки — приведение функции к линейному виду." Если 
регрессия в действительности линейна, то экспериментальные 
точки на графике располагаются примерно по прямой линии (см. 
рис. 3.3.5). Если регрессия удовлетворяет логарифмическому за- 
кону, то в полулогарифмических координатах (log z) ОЙ экспери- 
ментальные точки снова образуют прямую: происходит замена 
переменной 


и =@а09- 6, 


где 0 == log 5. | 

Логарифмируя значения 2 и и, и обозначая их на графике 
в координатах (log 2) О (log и), преобразуют в прямую линию 
рассмотренные выше: 
— степенную функцию 


у 


log и = log а, + h log z, 
откуда, обозначая logu=t, loga, =c и logz=ĝ, получаем 


t=c+ hð; 
— гиперболу 
log и = log а, — h log z 


(см. рис. 3.3.1); 
— показательную функцию 


108 и = о 
— экспоненциальную функцию 


logu = log а, | zloge. 


Аналогичным путем проверяется пригодность и более сложных 
функций *. Но для парабол й-ей степени, включающих не менее 
двух слагаемых при h - 2, этот путь не нодходит. 

Чтобы определить степень h полинома (3.2.3), необходимую 
и достаточную для аппроксимации эмпирических данных, после- 
довательно вычисляют для равноотстоящих значений независи- 
мой переменной (Zy) конечные разности: Ди,., — первой степени, 
АЗи,.. — второй и так далее до A’ инь — Пей, степени, как 
в общем виде показано в табл. 3.3.1. Как только Д*и,., для Heko- 
торого k при всех i становятся одинаковы ,** эту степень и прини- 
мают для аппроксимации полиномом. 

2. Вычисление неизвестных коэффициентов регрессии можно 
осуществить несколькими способами. В частном случае линейной 


* К. А. Семендяев. Эмпирические формулы. ГТТИ, 1933. 

** На практике ЛЁи;., не бывают одинаковыми. Будучи нанесены на 
график, они флуктуируют вокруг горизонтальной прямой тогда, когда № 
достаточна для аппроксимации, но, флуктуируя, возрастают или убывают, 
если hk еще недостаточна для нее. 
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| К вычислению конечных разностей й-ей степени : 


Au i41 


y 
A Но 


W, 


Таблица 8.3.1 


APui+h м 


Диз = из — u1 
Диз = из— u2 


Aug = U4 — Ug 


Auj-1 =Uj-1— Ui-2 
Аи; = Uj —И}-—1 


Аи +1 = Ша — Ui 


Дил-2 =Ии-2 — Ип-3 
Дип-1 = Ип-1 —Un-2 


Aun = Un — Ип-1 


А?из = Aug — Aug 


А2и4 = Aug — Аиз 


Аи; =: Ди; а Аи;-1 


Аш; 1=Аш1— Au; 


Д?ии-1 = Дии-1 — Аил-2 


Aun = Aun — Аил-т 


t ; . j 
А инея д" luin- — Ай turiha 


Ang с 5 : `X 


f 


_ (либо приведенной к линейному виду) регрессии можно провести 

«на глаз» прямую линию через экспериментальные точки на гра- 
фике так, чтобы расстояния до всех точек были по возможности 
малыми. Затем непосредственно с графика (рис. 3.2.2) определяют 
свободный член и значения ÂZ и Ди, причем пара координат 2,4; 
выбирается произвольно. Далее по формуле (3.2.2) вычисляют 
угловой коэффициент 4. Этот способ можно назвать графоаналити- 
ческим. При некотором навыке он обеспечивает хорошую точ- 
ность аппроксимации. 

В общем случае используют способ (метод) наименьших квадра- 
‚тов, который основывается на том, что сумма квадратов отклоне- 
ний от среднего арифметического значения меньше, чем от другой 
величины, сколь угодно мало отличающейся от среднего арифме- 
тического: 


n 


X (u; —u?}? = min, (3.3.4) 


i=] 


где u; — гтое условное среднее, полученное эмпирически; и; — 
теоретическое значение условного среднего; i = 1, 2,..., п — 
количество условных epom, полученных в эксперименте.* 

Чтобы вычислить k + 1 неизвестных коэффициентов регрес- 
сии а; (i = 0,1,2, ..., h, включая свободный член), необходимо 
составить систему из h $ 1 нормальных ‘уравнений. Для этого 
существует мнемонический способ, который заключается в й- 1- 
кратном повторении следующей процедуры. 

Пусть в общем случае для аппроксимации выбран полином 


` (3.2.3): 


ü =a tat aap а а. 


FE İ-TÞIÄÑ цикл (i= 0, 1, 2,..., h) процедуры состоит из 
двух шагов. 
Первый шаг. Исходное уравнение умножить на {-тую степень 


° аргумента Z: 


uzt = qz + azz ++ azz |... + apt azh, 
В результате преобразований получаем 
а а, та (3.3.2) 


Второй шаг. Результат первого шага (3.3.2) почленно подвести 
под знаки сумм (так как такие уравнения можно записать для 


* При малом количестве наблюдений условные средние нельзя вычислить. 
Тогда и; — это сами наблюдаемые значения переменной U, а п — количе- . 
ство всех наблюдений. 
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каждого из п условных средних и), вынося неизвестные коэффи- 
циенты за знаки сумм: 


N 


Зина +a еее Уи... mE 


i=1 i=1 


аа". (3.3.3) 


_ Например, при k = 2 n ao > 0, а, >> 0 имеем обычную параболу, 
уравнение которой 
| u = ly + а,2- а52°. 


В результате трехкратного применения изложенной процедуры 
получаем систему из`трех нормальных уравнений: 


Хита, Даа, X a, 


i=1 i=1 

X u= аа Xa X z 

Ха, Èa a iha X a. | 
i=1 i=1 i=1 


3. Проверка удовлетворительности аппроксимации опытных 
данных выбранным уравнением осуществляется путем вычисления 
коэффициента линейной корреляции между рядами эмпирических 
(u,) и теоретических (uł) значений регрессии: 


У ши} —nM [№1 -M [u}] 
г (и, и*) ЕЕ (3.3.4) 


п 3 > 
J, u}—n {M [и]? . > (uł)? —n {M [4] }? 
i=1 i=1 
Если величина коэффициента корреляции оказывается недостаточ- 
ной (см. стр. 309), то следует выбрать другое ее 
уравнение. 

Пример 3.3.1. В экспериментах по изучению слежения с пре- 
следованием, выполняемого человеком, измерялось латентное 
время реакции в зависимости от скорости движения цели.** Ре- 
зультаты приведены в табл: 3.3.2. (столбцы 1 n 2). Предположив, 
что величина скорости движения цели действует на реакцию испы- 
туемого аналогично тому, как действуют величины стимулов дру- 


n 
* Так как при i = 0 zi = 1, то 1= 


$ =4 | 
** Цель начинала движение мгновенно и двигалась равномерно с неко- 
торой скоростью (Г. В. Суходольский. О характеристиках человека при 


слежении. Автореф. канд. дисс. JI., 1968). 
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гих модальностей, можно думать, что искомая зависимость анало- 
гична закону Пьерона. Следовательно, аппроксимирующая функ- 
ция должна быть гиперболой. Такое предположение верно, если 
логарифмы латентного времени реакции в зависимости от логариф- 
‘MOB скорости образуют на графике ряд точек, флуктуирующих 
около прямой линии. Действительно, на рис. 3.3.1 точки с коор- 
динатами (lg z, lg и,), по табл. 3.3.2, группируются около пря- 
мой линии. Таким образом, исходной аппроксимирующей функ- 
цией может быть гипербола. 

Таблица 3.3.2 


Данные к расчету регрессии в примере 3.3.1. 


оо Ea SAA T 
2, и; lg zi lgu; (1g z;)? lg 2; lg uj и 
0,1 1,05 —1,00 .- 0,02 1,000 —0,.020 | £27 
0,2 _ 1,08 —0,70 0,03 0,490 — 0,021 0,89 
0,4 0,57 — 0,40 — 0,24 0,160 0,096 0,63 
0,6 0,56 — 0,22 — 0,25 0,048 0,055 SEY y 
0,8 0,52 — 0,10 — 0,28 0,010 0,028 0,45 
2 0,22 0,30 — 0,66 0,090 — 0,198 0,28 
4 0,24 0,60 —0,62 0,360 — 0,372 -0,20 
6 0,26 0,78 — 0,58 0,608 — 0,452 0,16 
8 0,15 0,90 — 0,83 0,810 — 0,747 0,14 
10 0,16 1,00 — 0,80 1,000 —0,800 | - 0,13 
45 0,08 5$. 48 —1,10 1,392 —1,298 0,10 
29-7 0,10 1,30 — 1,00 1,690 — 1,300 0,09 
25 0,07 1,40 —1,16 1,960 —1,624 0,08 
30 0,03 1,48 — 1,52 2,190 EE — 2,250 0,073 
35 0,08 1,54 — 1,10 2312 — 1,694 0,068 
40 0,08 | 1,60 — 1,10 2,560 — 1,760 0,063 
45 0,05 1,65 — 1,30 2,722 —2,145 0,060 
50 0,12 СТО —0,92 | 2,890 —1,564 0,056 
100 0,06 >. 00 —1 22 4,000 — 2,440 0,040 
200 0,03 2,30 — 1,52 5,290 — 3,496 0,020 
20 A 
5:54 17,31 — 16,15 31,64 — 22,00 3.32 
i=1 


Примечание. и; — эмпирические, и}? — теоретические средние ариф- 
метические значения ‚латентного времени pax; сек, Zi — скорости дви- 
жения цели, мм/сек. 


Остается разобраться еще в одном вопросе. В формуле 4 закона 
Пьерона: 


а 
= тя To 


имеется свободный член (To), который выражает «несократимый» 
компонент латентного времени` реакции. Это означает, что даже 
при «бесконечно большой» интенсивности (Г) стимула т = т, > 0. 
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При классической методике измерения латентного времени реак- 
ции, когда отсутствует возможность предвидения и антиципации 
момента появления стимула, это в действительности так. Но 
в условиях периодичности предъявления стимула имеется возмож- 
ность обучиться предвидению и антиципации момента появления 
стимула, в результате To может быть нулевым и даже отрицатель- 
ным.* В нашем случае эта ситуация как раз и имела место. В част- 
ности, при бесконечно большой скорости движения цели ** латент- 
ное время реакции в среднем составляло 0,03 сек. Таким образом, 


>10: 2-08 02 бас а ia 22 


Рис. 3.3.1. Зависимость латентного времени реакции Uj, сек, 
от скорости движения цели Z, мм [сек. 
По оси абсцисс lg Zj» NO оси ординат lg Uj, точками обозначены экспе- 


риментальные prasa Прямая линия соответствует А 
уравнению: lg и; = — 0,4 — 0,5 lg Zi 


для наших экспериментальных условий аппроксимирующая ги- 
пербола должна быть без свободного члена: 


<; № 
Е: 
где и — среднее арифметическое значение латентного времени 
реакции, сек; Z — скорость движения, мм/сек; h и а — неизвест- 
ные коэффициенты, которые и следует вычислить по данным экс- 
перимента. 

Для вычисления коэффициентов используем метод наимень- 
ших квадратов. Логарифмируя исходную гиперболу, получаем 
уравнение прямой: 


lgu =lga —hlgz. 


* Cm. E. И. Бойко. Время реакции человека. `«Медицина», 1964, 
р; TT: 
** Это достигалось экспериментально одновременным исчезновением цели 
в одном месте и ее появлением в другом. 
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В соответствии с рассмотренной процедурой составляем систему. 
из двух (mo числу неизвестных а нормальных 
уравнений: 


> zu =201ga—h X lg Z;, 


у ИЕ u: “lg 21) = вах Ig z, — ь> (lg 2/)*. 


Необходимые значения lg 2,, lg и,, (ви, .1© z), (lg 2,)?, а также 
всех сумм, входящих в нормальные уравнения, представлены 
в табл. 3.3.2. ; 

‚Записав систему уравнений в явном виде, решим ее способом 
‘исключения переменной (умножим первое уравнение на 417,34, 
второе — на —20 и сложим почленно): 


—16,15 =20 lga —17,З1А| 17,31 
— 22,00 = 17,31 Ig a — 31,64h |— 20 


— 279,5565 = 346,2 lg a — 299,6361h 
440,0000 = — 346,2 lg a + 632,8000% 


160,4439 = + 333,1639й; 
- 160,4435 
а" 
[20,12'а = 17,31*0,481 — 16,15 ~ — 7,82, 
—7,82 o 
lg a = T 0,391 
Учитывая значительное рассеивание экспериментальных точек 
и по соображениям удобства, округлим: h = 0,5 и ва = —0,4. 


Тогда искомое уравнение регрессии в логарифмической форме имеет 
вид (рис. 3.3.1): | 
lg и* = —0,4 — 0,5 lg z. 


Потенцируя, окончательно получаем: 


и* == при 0,1 = z< 200 (мм/сек). 
Z 
Для проверки удовлетворительности аппроксимации вычис- 
лим по формуле (3.3.4) коэффициент корреляции г (и, и*). Проме- 
жуточные величины представлены в столбцах 1 и 7 табл.-3. 3. 2 
и в табл. 3.3.3, 


5.54 5,32. 
те w 3,4199 — 20 5 . S5 z 
5 5,512 y 5,322 
V saso-2 3 4559—20: “Za * / 3,5025—20. -3ga 
1,9542 0.97 


SYT 9379 . 2.0824 
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Таблица 3.8.3 


Промежуточные величины для расчета коэффициента 
корреляции к примеру 3.3.1 


i - PEF | upu 
1 1,1025 1,6129 1,3335 
2 1,1664 0.7921 0,9612 
3 0,3249 ` 0,3969 0,3591 
4 0 3136 0,2704 0,2912 
5 0,2704 0,2025 0,2340 
6 0,0484 0,0784 0,0616 
T 0,0576 0,0400 0,0480 
8 0,0676 0,0256 0,0416 
9 0,0225 0,0196 0,0210 
10 0,0256 0,0169 0,0208 
14 0,0064 0,0100 0,0080 
12 0,0100 0,0081 0,0090 
13 0,0049 0,0064 0,0056 
14 0,0009 0,0054 0,0022 
15 0,0064 0,0046 0,0054 
_ 16 0,0064 0,0040 0,0050 _ 
17 0,0025 0,0036 0,0030 
18 0,0144 0,0031 0,0067 
19 0,0036 0,0016 0,0024 
20 0,0009 0,0004 0,0006 
20 
; 3,4559 3,5025 | 3,4199 


20 20 
Примечание. 2u; =5,51 и uj = 5,32 приведены B 
i= = 
табл. 3:32: 


Итак, уравнение u* = 0,4.2 95 можно рассматривать B ка- 
честве реализации закона Пьерона для нашей экспериментальной 
ситуации. 

Пример 3.5.2. При изучении эффективности вычислений, осу- 
ществляемых человеком вручную, было установлено, что затраты 
времени на вычисления определяются не спецификой арифмети- 
ческих действий, а количеством элементарных операций (сумми- 
рование, вычитание, умножение и деление в пределах одного деся- 
тичного разряда, а также переход из разряда в разряд): * В экспе- 
риментах с опытным вычислителем, который суммировал на счетах 
столбцы специально подобранных чисел, были получены оценки 
среднего времени суммирования, соответствующие переменному 
количеству элементарных операций (2) сложения и перехода 


_ * См. H. М. Кандарацкова, Г. В. Суходольский. 06 
эффективности и надежности элементарных вычислительных операций. 
В сб. Экспериментальная и прикладная психология, вып. 1, Изд. ЛГУ, JI., 
1968. 


13 г. в. Суходольский _ 493 
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Таблица 3.8.4 


Исходные данные к примеру 3.3.2 


Количество элементарных операций (zi ) 
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8 13 42 69 T4 96 124 129 152 183 
| 
с |5 [50 |70 | 8 | 9] 50 150 [20 
ва 8 | 13| 16| 25 | 45 | 55 | 75 | 105 | 405 | 150 | 180 
ет |6 11247 | 25 | 45 | 50 | 90 | 85 105 | 125 | 190 
5 —|.— 120 | 20 | 50 | 55 | 75 | 90] 140] 450 | 150 
= — | — | 20 | 20 | 45 | 50 | 75 | — | 105 | 145 | 160. 
Е те 47 855 | 40 54571-90 = 405 Е. | 240 
о 
к : 
Е | Сумма | 24| 36 | 105 | 160 | 275 | 325 | 470 | 370 | 620 | 690 | 1100 
= : 
|* 
1| Mlu/z] | 7 | 12 | 18 | 27 | 46 | 54 | 78 | 92 | 103 | 138 | 183 


Примечание. 


Хронометраж выполнен с точностью до секунды, 


поэтому условные средние округлены до целых: ап {М[и/2;]}. 


9: 20 60 100 i40 180 


Рис. 3.3.2. Регрессия среднего времени 
суммирования, полученная сглажива- 
нием «от руки». 

По оси” абсцисс — количество элементарных 
операций суммирования; по оси ординат — 
время, cen. Крестиками обозначены эмпири- 
_ ческие данные, кружками — «выравненные» 

значения среднего времени. 


из «младших» десятичных 
разрядов в «старшие». Резуль- 
таты представлены в табл. 
3.3.4. В нижней строке той 
же таблицы приведены услов- 
ные средние значения вре- 
мени суммирования (М [и/2,]). 

Чтобы выбрать аппрок- 
симирующую функцию, на- 
несем значения (М [и/5,], z) 
на график и от руки проведем 
монотонную кривую, лежа- 
щую, по возможности, вблизи 
всех экспериментальных то- 
чек (рис. 3.3.2). Заметим, 
что при этом естественно счи- 
тать! u= 0- при:2 ==0. 

По внешнему виду полу- 
ченная кривая напоминает 
параболу й-ей степени. Про- 
веряя это ‘предположение, 
определим конечные разности 
й-его порядка (см. табл. 


3.3.1). Непосредственно по эмпирическим данным этого сде- 
лать нельзя, так как разности значений аргумента (Az) 
не одинаковы по величине. Поэтому выберем новые значения Zy 
и соответствующие им «выравненные» Up, которые снимем непо- 
средетвенно со сглаженной кривой (рис. 3.3.2, кружки). Эти 
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Таблица 8.8.5 
_ Вычисление приращений h-ero порядка для определения 
степени полинома, необходимой и достаточной для 


аппроксимации эмпирических значений 
среднего времени суммирования 


. Выравненные 
H ния среднего 

а в и Ang А 

z суммирования 

Ив 
0 0 PES TR 
10 9 5 — 
20 10 T 0 
30 16 6 1 
40 : 24 8 2 
50 30 6 —2 
60 38 8 2 
70 46 8 0 
80 S 9 1 
90 . 64 9 0 
100 73 9 0 
110. 83 Бе | 1 
120 92 >H —1 
130 105 -43 4 
140 118 13 0 
150. 132 14 1-- 

160 "`` 14 0 
‚ 170 160 S 0 
180. 178 18 4 


Примечание. Значения Up сняты непосредственно 
с графика на рис. 3.3.2. 


значения, а также вычисленные по HAM- конечные разности 
представлены в табл. 3.3.5. Можно видеть, что разности второй 
степени группируются вокруг горизонтали. Таким образом, 
в качестве исходной аппроксимирующей функции подходит обыч- 
ная парабола без свободного члена: 


u, = bz; - 427, 


где и; и, — определены экспериментально (i = 1, 2,..., 11), 
a b n a — неизвестные коэффициенты, которые следует вычислить. 

Система нормальных уравнений для вычисления а и b по Me- 
тоду наименьших квадратов получается применением рассмотрен- 
ной процедуры: | 


Уш-ьиах 2, 


i=1 i=1 
È zu Daka 2}. 
1=1 i=1 
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Таблица 8.3.6 
Данные к расчету регрессии в примере 3.3.2. 


8 РЕ, 56 64 512 5 


1 
2 13 12 156 169 2 197 8 
3 A р E 486 729 19 683 17 
4 42 27 1134 1 764 74 088 28 
5 69 46 - 38174 4 761 328 509 49 
6 71 54 3 834 5 041 357 911 51 
7 96 78 7 488 9 216 884 736 14 
8 121 93 11253 14 641 1 771 561 100 
9 129 103 13 287 16 641 2 146 689 109 
10 152 138 20 976 23 104 3 511 808 136 
11 ’ 183 183 33 489 33 489 6 128 487 177 
11 
р 911 | 159 | 95 333 109619 15 226 181 ae 
įi=1 | 


_ Обозначения: 2;— количество элементарных операций; и; — услов- 
ное среднее арифметическое значение времени суммирования, соответст- 
вующее ‘{=тому количеству элементарных операций; и; =ant {и*}, где 


и* = 0,5632 + 0,002222 (см. в тексте). 


Промежуточные величины и их суммы представлены в табл. 3.3.6. 
Подставляя их в уравнения, запишем систему в явном виде: 


‚ 759 =91446 F 109 619а,. | 
95 38338 =109 6196 + 15 226 181 .а. 


Решение проведем способом подстановки. Из первого ра 
ния находим 
== —— (759 — 109 619 - a) 


и подставляем во второе уравнение: 
95 333 = эт —— 109619 (759 — -109 619-а) + 15226 181 - a; 


911:95 333 = 15 226 181 -941a + 109 619.759 — 109 619° -а 
86 848 363 = 13 871 050 891 - a + 82 652 726 — 12 016 325 161 -a; 


AA T : 
— 185 4724730 ^^ 0,0022; 


b =- тт: (759 — 109 619 - 0,0022) ~ 0,563. 
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Следовательно, искомая регрессия. выражается уравнением пара- 
болы (рис. 3.3.3): - = 
и* = 0,563z + 0,002222. 


Так как измерения времени выполнены с точностью до 1 cek, 
то теоретические значения среднего времени на суммирование 
ея до целой части и} = ant { и* }, u? приведены в табл. 3.3.6. 


y 


180 


Рис. 3.3.3. Среднее время сумми- 740 
рования (ц*) в зависимости от 
количества «элементарных» опе- 
раций (2). 100 
= 0, 5632 -- 0,002222. По оси opan- 
ее — время, сек; по оси абсцисс — 
2, шт. Крестики — эмпирические зна- 
чения среднего времени суммирования 60 
(табл. 3.3.6). 


20 


QO 2% 60 100 40 180 


Аппроксимация удовлетворительна, так как r(u, и*) ~0,99. 
Следует отметить, что при Z = 1 (имеется всего одна элементарная 
операция сложения) полученная регрессия дает средние затраты 
времени 0,56 сек. Это совпадает с результатами измерений в дру- 
гих опытах. * 


3:39:02. бе числовых характеристик при небольшом. 
количестве-экспериментальных данных 


В психологической практике нередко количество пар значе- 
ний £; у, изучаемых случайных величин X и У, наблюдавшихся 
в эксперименте, составляет несколько десятков. При таком неболь- 
шом количестве экспериментальных данных нельзя определить 
эмпирические функции распределений, но можно вычислить 
оценки всех числовых характеристик двумерной системы, что. 
оказывается полезным для. планирования фундаментальных ис- 
следований. 

Можно выделить два случая. Первый — количество‘наблюдений 
п < 30, при этом можно вычислить только безусловные средние 
арифметические и дисперсии, а также коэффициент линейной кор- 
реляции и через ‘него — коэффициенты регрессии. Здесь, однако, 


* См. Н. М. Кандарацкова вт. В ола 
Ук. соч., табл. 1. 


ых 
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невозможно решить, линейна или нелинейна корреляция, а по- 
тому использование линейных корреляционных мер не обосно- 
вано и может дезинформировать исследователя, если величина rxy 
окажется близкой к нулю. 

Расчет перечисленных мер при п < 30 (а при Seok tonnoiri — 
при любом N) осуществляется последовательно. Сначала вычис- 
ляются безусловные средние арифметические 


м =1 У 


i=1 


ми = Yi. 


1=1 


Далее вычисляются безусловные дисперсии и стандартные откло- 
нения: 


DIX]=4 X z}— MIX); - o[X]=V DIX] 


i=1 


s- Sy (МГУ olyi= VDI. 


i=] 


Ковариация здесь определяется по формуле 


COV [ХУ] =-- Узи ММУ (3.3.5) 


i=1 


после чего по формуле (3.2.13) рассчитывается коэффициент корре- 
ляции и по формулам (3.2.16) — коэффициенты линий регрессии. 

Второй случай — количество наблюдений в пределах 30 <n < 
< 200 .* Здесь уже можно осуществить простейшую группировку 
данных, что позволяет решить вопрос о форме корреляции и опре- 
делить в явном виде регрессии и корреляционные отношения. 

Группировка в этом случае состоит в том, что области наблю- 
дения переменных Х и У квантуются на произвольной величины 
интервалы Ах и Лу, число которых должно быть не меньше 4—5. 
Экспериментальные данные разносятся в таблицу (см. табл. 3.3.9), 
после чего подсчитываются частоты f; — переменной X принять 
значение на Г-том интервале Ах (=1,2,..., т) n f; — перемен- 
ной У принять значения на ]-том интервале а ЧН 
Далее осуществляются вычисления: 


* Прип = 200 можно осуществлять обычную группировку и вычислять’. 
распределения _ (см. пункт 3.3.3). 
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— Условных средних арифметических 


f; } 
1 
М (9/2) == Уи 


= | (3.3.6) 
J 
1 
М(е/у) = F7 Ут 
J 


g=1 


где ¢— номера значений у;, наблюдавшихся совместно CO зна- 
чениями T; на том интервале Ах, g — номера значений х;, Ha- 
блюдавшихся совместно со значениями у, на ]-том интервале Лу; 
fı и f; — определены выше; ие ; 

— координат «привязки» для условных средних арифметических: 


у 


F 
` y lys — 
Е (2) = Узи, | 


t=1 


Š (3.3.7) 
J 
4 & 


&=1 


где E (x) — среднее арифметическое значение величины X на 
1-том интервале Ах, которому соответствует условное среднее 
М (и/2;); Е (у;) — то же для каждого условного среднего М (х/у,). 

Полученные точки с координатами ‘E (7;), М (у/х;)} служат 
основой для определения регрессии «У по X», а точки с координа- 
тами {M (2/у,), Е (у;)} — для определения регрессии X по У, кото- 
рые далее подлежат аппроксимации. После определения а, A 
Hajy (в линейном случае) коэффициент корреляции вычисляется 
через них по формуле (3.2.14). 

Вычисление безусловных средних арифметических можно те- 
перь осуществить через условные средние: 


i=1 


M [Y1 = Ñ M (/2) fi 
| (3.3.8) 


~ 


Е 
M[X]= 4 УМ(е/у) fi. 


j=1 


Janee вычисляются все необходимые дисперсии: 
— безусловные, как и в первом случае; 


p” 
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А ое 


— дисперсии условных средних: 


i=1 


DM w/z) = № M (viz) МЕ d | | 
(3.3.9) 


R 
D IM (2/y)) = ХМ) МХ. fj; 
j=1 - 
= ‚ остаточные дисперсии: 
D, за = + ŞD iyi. i | 
a . (3.3.10) 


Do I/v == Y рул: fj 
jel 
li 


rne n= X fi= $ fi; рты = fy Уи, — IM (y/2;)]? — условные 


1=1 


; 
дисперсии У по X; D [z/y;] ESR Pa [y (x/y;)]? — условные 
| ; 
g=1 


дисперсии X по У. 


В итоге по формулам (3.2.7) вычисляются корреляционные | 


отношения, а по формуле (3.2.12) — коэффициент детерминации. 
Пример 3.3.3. В плане комплексного исследования личности 
у студентов психологического факультета определялся социометри- 
ческий статус на курсе (У) и в своей учебной группе (Х). Резуль- 
таты представлены в табл. 3.3.7. Определим количественные харак- 
теристики двумя способами. 
Для вычисления безусловных средних, дисперсий.и ковариа- 


ции по формуле (3.3.5) необходимы квадраты: X? и Y°’, произве-' 


дения ХУ, а также их суммы и суммы исходных данных. Эти 
величины приведены в табл. 3.3.8; по ним вычисляем: 


1041 140,3 


МУ] =-5-=25, М[Х]р= 5 == 3,34; 
РУ t 25—83,  D[X]= Но. 3,342 == 91; 

ее а 

COV [XY] =E — 25.3,34 => 173,2; 

а: 
T= -338-954 ~ 0,68. 
По формулам (3.2.15) 
73.2 173,2 
UT 1,9, @xiy = 854 —0. 2i. 
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Таблица 8.8.7 


Исходные данные к примеру 3.3.3. 
У—социометрический статус на курсе, Х—социометрический 


статус в своей группе, % - 


Y X У X Y X я 
48 1 45 9 8 4 
— о 5 23 8 73 49 
100 22 64 15 23 2 
— f — 1 11 4 23 6 
14 =A, еее: e, =e 15 17 
14 —0,5 14 sF 1 SA4 
14 5 sH а 5, 26 8 
14 9 60 8 14 -4 
—28 0 34 8 81 7 
46 а 14 =”. 23 9 
42 11 —47 = 114 4 
27 15 40 2 49 0,5 
19 —8 31 15 26 8 
83 0 20 —10 11 9 
Таблица 8.3.8 
К раечету коэффициента линейной корреляции по несгруппированным: 
данным 
У X y? хз Ух У х уз | X? Ух 
48| 1 2304 1 48 60 8 3600 64. 480 
—9 j9 81| 81 81 34 8 1156 64 272 
100| 22 1410 000ļ| 484 2200 14 —2 121 4 —22 
—4|—4 1] 121 Г > —28 2209 | 784 1316 
t46 196} 36 — 84 40 2 1600 4 80 
14—05 106. 925 f —=7 31 15 961 | 225 465 
14 5 196 | 25 70 20 =10 400 | 100 —200 
11 9 4124|: 81 99 8 4 64 16 32 
вх. 0 784 0 0 73 19 5329 | 361 1387 
46 2+ 2146 4 92 23 2 529 4 
42| 11 | 1764| 124, 462 23 6 529 „| 36 132 
271 729| 225 405 15 17 225 | 289 255 
191: —8 361| 64 55а 1 7 1 49 
83 0 | 6889| 0 0 26 8 676 64 208 
45 9 | 2025| 81 405 24 4 196 16 56 
23 8 529 \ 64 184 81 7 6561 49 567 
64| 15 | 4096| 225 960 23 9 529 81 207 
11 4 121| 16 44 14 4 121 16 44 
=I 8 324| 64 144 49 0,5| 2401 0,25 24,5 
14| —07 196 0,49 а: 26 8 676 64 208 
—441 |—45 1241 | 225 165 11 9 124 81 99 
Суммы | 1041 140,3 61 155 | 4289,99 10 780,3. 
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_ Прежде чем группировать экспериментальные данные, построим 
на графике поле корреляции, а затем, как это сделано на рис. 3.3.4, 
- расчленим его на интервалы, по возможности соблюдая два усло- 
вия: 1) границы проходят между точками, 2) в каждом интервале 
оказываются два и более значений (иногда крайнюю точку можно 
оставить и одну). Значения границ интервалов снимаются прямо 
с графика и записываются, как показано в «шапке» табл. 3.5.9. 


“ 
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оне: 0-9 


Рис. 3.3.4. Поле корреляции к при- 
меру 3.3.3. 


По оси абсцисс — значения социометри- 
ческого статуса в своей группе (х; ), по оси 


ординат — значения социометрического 
статуса на курсе (yj). Точками обозначено 


совместное появление пар значений X, itj’ 


пунктиром выделены интервалы группи- 
ровки данных в табл. 3.3.9. 


Рис. 3.5.5. Линии регрессии к при- 
меру 3.3.3. 


По оси абсцисс — социометрический ста- 
тус в группе (х;), по оси ординат — на 


курсе (у). Крестиками обозначены услов” 

ные средние М (у/х;), кружками-условные 

средние М (х/у;), сплошная линия — ре- 

грессия у = 2х + 18, пунктирная — pe- 
грессия x = 0,2у — 2. 


Таким образом, поле корреляции в нашем примере оказывается 


расчленено на т = 


4 интервала Ах и на k = 7 интервалов Лу. 


Группировку данных производят так. Из табл. 3.3.7 последо- 
вательно выбирают пары значений у; £; и записывают в табл. 3.3.9 


на пересечении соответствующих интервалов Луйх: 
в нижнем треугольнике, а значение L 


значение у; 
— в верхнем треугольнике. 


Окончив разноску, подсчитывают частоты f; по столбцам и f; — 


по строкам. 


Получение условных средних и соответствующих им коорди- 
‘нат «привязки» осуществляется по столбцам и строкам табл. 3.3.9. 
Например, по первой строке и формулам (3.3.6) и (3.3.7) вычисляем: 


М (z/y,) = Ż [(—8) + (—15) + (— 28) + (0)] = — 


= | 
Е (y1) aA 
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[(—18) + (—11) + (—47) + (—28)] = —26. 


‹ $ 
Нанесем значения условных средних на график с координатами 
Е (y;) и Е (z) (рис. 3.3.5) и определим коэффициенты регрессий 
графоаналитическим способом. 

По линейке проведем прямые на графике так, чтобы расстоя- 
ния от экспериментальных точек были по возможности наимень- 
шими. В частности, регрессия У по Х (сплошная линия 
на рис. 3.3.5) проводится через три крестика, а регрессия Х по У 
(пунктир на рис. 3.3.5) — через кружок с координатами (0, —2) 
и через середину расстояния между кружками с координатами 
(79,9) и (100, 22). Теперь по графику можно с приемлемой TOT- 
ностью определить коэффициенты регрессий: бу = 18 для регрес- 
сии У по X, так как в этой точке сплошная линия на рис. 3.3.5. 
пересекает ось ординат; 


E E, 2. 
E TETE I — 2 
5. — —2 для регрессии Х по У, так как в этой точке пунктирная 
линия на рис. 3.3.5 пересекает ось абсцисс; 
Е ЗВ 
лу E = 02 


Можно видеть, что значения угловых коэффициентов ау/х и @ах/у, 
полученные -графоаналитическим способом, мало отличаются от 
вычисленных через ковариацию: | 


Г = у Я у/х@х/у —(И 02.2 — 0,63. 


Необходимо отметить, что графоаналитический способ не сле- 
дует применять для точных расчетов при значительном разбросе 
эмпирических условных средних и при нелинейностях. 

Итак, аппроксимированные регрессии имеют вид 


yt = 24-548 =u at= 0, 2y — k 


Te у* — теоретическое среднее значение статуса на курсе при 
условии, что статус в группе имеет значение L; Lë — теоретиче- 
ское среднее значение статуса в учебной группе при значении 
статуса на курсе у. 

Займемся вычислением коэффициентов детерминации. Для рас- 
чета Nyx и ?х/, необходимы значения М [У] a M [X |, которые 
вычислим по формулам (3.3.8) и данным табл. 3.3.9: 


МТУ] = ее Е 15+ 31. 43+452.6] 225, 


М1х1= (13) .4+(—2).4+4-20+6-84-14,5-2+ 
9.8 - 22.1] —=3,3, 


что совпадает с ранее вычисленными значениями. Безусловные 
дисперсии получены выше: D [У] = 831 и D [X] = 91. 
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Y i 
S | X Таблииа 3.3.9. 
Двумерная группиродка и вычисление условных средних при небольшом числе наблюдений (40 +200) 


С ПЕСЕН a ВЕСЕЗЕ: АИ 


>в 15 i 
4 


/ 
i 
: 


| 

£ 
e}. 
A 
5 

l 
5 


G 
г 


> 
© 


Используя формулы (3.3.9), рассчитаем дисперсии условных сред- 
` них; промежуточные величины приведены в табл. 3.3.10 и 3.3.41. 


D [M (9/21 =+ = 275,83 


D [M (z/y;)] = A = 43, 45. 


Затем по уравнениям (3.2.7а и 6) вычислим и коэффициенты детер- 
минации, и корреляционные отношения. 
Таблица 3.8.10 
Промежуточные величины к расчету 1]; y 


fi AM (am): (AM)? f; 
8 —29 841 6728 
15 —4 Е: 15 
13 "6 36 468 
6 гг # 729 ‚ 4ЗТА 
Сумма 11 585 


Примечание. AM =M (у/2:) —М [У] 


Таблица 3.3.11 
” Промежуточные величины к раечету nọ; 


fj AM {AM}? {АМ} 1 
4 —146.3 265,69 1062,76 
4 S 28 09 412.36 

20 0.7 0.49 2g; 

8 27 729 a 5832 
2 82 67.24 134.48 
3 57 32.49 97.47 
1 187 349.69 | 349.69 

Сумма 1824.88 


Примечание. АМ=М (z/y) —М [X]. 


Коэффициент детерминации статуса на курсе статусом в своей 
группе составляет 


___ 215, в. 


откуда соответствующее корреляционное отношение Пу/х ~ 0, 57. 
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Коэффициент а: статуса в группе статусом на курсе 
составляет 


n= SE 0,477, 


откуда корреляционное а. х/и = 0,69. 
Осуществим проверку найденных значений, вычислив коэффи- 
циенты детерминации через остаточные дисперсии (формулы 


3.3.10): 
D, [y/z;] ~ 563,47, тогда Ту/х = 1 — 563,47 0.32: 


аи 
Г, [2/уд =47, тогда Ши 1 — 5r ~ 0,48, 


т. е. вычисления правильны. 

Сопоставляя ранее вычисленное значение коэффициента корре- 
ляции (г = 0,63) с корреляционными отношениями, можем видеть, 
что в_рассматриваемом случае 


r SHAEF (Пух + хуи). j 


Это свидетельствует о случайности различий между коэффициен- 
тами детерминации и о хорошем приближении корреляции к ли- 
нейной. | 
В заключение, интерпретируя полученные результаты, под- 
черкнем различия между коэффициентом детерминации как мерой 
тесноты связи и коэффициентами регресии, характеризующими 
скорость изменения средних значений одной случайной величины 
при изменении другой. Так как односторонней обусловленностью 
из-за недостоверности различий Ту/х и Тх/, можно пренебречь, то 
можно считать, что между статусом студента на курсе и в группе 
существует взаимосвязь почти в половине ` случаев: 


Пу/х = 0,33 = r” < ху, = 0,48. 


Однако для этой доли случаев относительное (в единицах стандарт- 
ного отклонения) изменение среднего статуса на курсе при изме- 
нении статуса в группе осуществляется в десять раз (ау/х : @х/у => 
a 10) интенсивнее, чем относительное изменение среднего статуса 
в группе при изменении статуса на курсе. Разумеется, эта пред- 
‘положительная интерпретация требует дополнительной экспери- 
ментальной проверки. | 


3.3.3. Полный расчет количественных характеристик двумерной 
системы | 


Чтобы нолностью количественно охарактеризовать систему 
из двух случайных величин Х и У, необходимо иметь большое 
число экспериментальных данных: минимально N Æ> 200 пар зна- 
чений zy; Для вычисления законов распределения необходимо 
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осуществить двумерную группировку данных, которая в принципе 
выполняется по тем же правилам, что и одномерная группировка. 
Для каждой из величин определяют интервалы квантования (Ày 
и Лу), причем нужно, чтобы количество интервалов (k) было оди- 
наковым для X и У; обычно k = 8 =+ 12. Затем определяют OT- 
дельно для Х и У границы и средние значения интервалов, 
которые записывают в «шапку» группировочной таблицы (см. 
табл. 3.3.12). Желательно выбирать границы так, чтобы среди экс- 
периментальных данных «граничные» значения отсутствовали. 

Факт появления пары значений совместно на интервалах Ах 
и Лу кодируют в пятиричной системе, как делалось прежде. Окон- 
чив кодирование, подсчитывают частоты совместного появления 
fij, затем количество сгруппированных наблюдений * 


м LAJA. ah 


i=1 j=1 
M частости совместного появления значений T;yy на об паре 
интервалов Ах и Ày, где fij >20 
fij 
CNES NE 
Далее определяют безусловные эмпирические вероятности распре- 
деления У: 


Е 
р; = > Pij 
t=1 


и распределения X: 


S Pij: 


j=1 


а после этого и условные эмпирические вероятности распреде- 
лений х/у;: 


Pij 
| ЕЕ 
и распределений у/х;: : 
Pij 
Piji = arta : 


Совокупности перечисленных вероятностей, сопоставленные соот- 
ветствующим значениям переменных, образуют эмпирические за- 
коны распределения, полностью характеризующие двумерную 
систему **. 


* В ходе кодирования несколько значений может быть потеряно или 
ошибочно ` приписано, поэтому п Æ ДР 

** В дальнейшем все эти законы должны аппроксимироваться теорети- 
ческими функциями распределения, что, в принципе, аналогично одномер- 
ному случаю, но выходит за рамки нашего изложения. 
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- Для расчета числовых характеристик по распределениям ис- 
‘пользуют упрощенные методы, основанные на линейном преобра- 
зовании исходных величин X и Y: 


(3.3.11) 


где Ахи Ау — условные начала: отсчета, выбранные вблизи пред-_ 


полагаемого центра рассеивания. С учетом преобразований (3.3.11), 
и: формулы можно представить следующим образом. 
Для безусловных средних 


М [X] = Ax + Ахтх, 7 3349.) 


где величина "a Ope тремя способами: 


mS an D х(У= в (3.3.126) 


i=1 j=1 i=1 j=1 \#=1 
М [У] = Ау-- Лу. ту, (3.3.13а) 
где также 
k k 
„ »„ Pi 
my = УИ-Р -SSi Pij = Sí y w), ` pi- (3.3.136) 
j=1 is] isl i=1 \/=1 
Для условных средних | 
z. М2) АА. Ум (3.3.44) 
z i=1 > 
Pi : 
M (9/2) = Ay + Ay- Syn a (3.3.146) 


j=1 
Для безусловных дисперсий 


р [У] =^№. D' [Y], где 


A (3.3.45a) 
D'[Y]= È 2 (yi): Pi — (ту)? 
DIX] =4}-D' [X], 
о (3.3.456) 


В Е 
D’ [X 1= 2 21 (20°. pu — mx)’; 
а +m : 
здесь тх и ту определены выше. Для дисперсий условных 
средних 
D [М (z/y;)| = АХ: О’ [М (z/y;)], где 


в РА 2 
D' [M (2/у;)] = > (У Ti 2u) -р;— (тх)? 


(3.3.16ба) 
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{ 
ЧУ 
i$e ji 
MEDEA 
АИ 


D M 1 Shn D’ M 171) - 
[ (9/0 [М (у/з)Т, где _ (3.3.166) 


D’ [M (и/2)1 = У [У и в} : Pi — (т). 
1—1 РЕ. 
Для остаточных дисперсий 
D, [5/1 =А%. 0’ [z/y;], 
&ь a Е V | (6.3.47а) 
D; хеш $ Se м-У(У: ziti) p Pi 
i=1 j=1 ]=1 \#=1 
и 
Do =A. D’ 7 
[y/z;] [y/z;]; где (3.3.476) 


r z 
08 [y/z,] = X X UD? Pu — AOE A 


Сопоставляя уравнения (3.3.15}—(3.3.17), можно видеть что 
выполняются равенства 


D’ [X] = D’ [М (z/y;)l + Do e] 
D'[Y]= D" [M (y/z;)]+ Do [y/z;], 

поэтому коэффициенты детерминации равны: 

О’ [М (z/y)] Do [z/y;] 


2 = —— O —_—_—_—— 
о Е DPA o (3.3.8) 
nz, — DM w/z] _ | _ Doluan 
mer DR] e Dp] 


Аналогично, в преобразованных величинах выражаются: KO- 
эффициент корреляции 
2 ВО] (3.3.9) 
Ур’ [X]: D' [У] 


где 
k 


COV: [ХУ] = Ух ti’ у: Pi — Mx: ту, (3.3.10) 


i=] j=1 
и коэффициенты регрессии 
Ху COV’ [ХУ] 
@у/х = Ay. D’ [X] ? 


a., №: COV’ [XY] 
г: ЖЕ Лу. D’ [У] 


(3.3.44) 
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Таблица 3.3.12 
Исходные данные к примеру 3.3.4 


Xi — границы интервалов группировки амплитуд, мм; Аух=15; у; — границы интервалов группировки полупериодов, мм; Ху = 0,7 мм, = 


= (),023 сех; N = 2143. 


м 
7,5 22,5 37,5 52,5 |* 67,5 82,5 97,5 112,5 127,5-| 142,5 | 157,5 | 472,5 
маи И 37,5 52,5 67,5 82,5 97,5 112,5 127,5 142,5 |1 157,5 | 172,5 | 187,5 


У 


F 


Пример 3.3.4. При изучении амплитудно-частотных характери- 
стик руки человека в условиях направленного уменьшения и уве-. 
личения амплитуды совместно регистрировались значения полу- 
периодов (У) и амплитуд (Х) колебаний руки. Результаты одного 
из испытуемых сгруппированы в табл. 3.3.12. Обработку экспери- 
ментальных данных начнем с вычисления частостей совместного 
распределения значений полупериодов (Y) и амплитуд (Х), без- 
условных распределений, средних арифметических, дисперсий. 
и коэффициента корреляции. | 

Частости р, совместного распределения, ‘представленные 


в табл. 3.3. 13, вычислены с округлением до одной тысячной так, 
12 12 

чтобы выполнялось условие 2 F Pi; = 1. Суммируя, р;; по стро- 
i=] 7=1 

кам (по #), определим безусловные частости Pj, совокупность KOTO- 

рых в сопоставлении совокупности интервалов группировки Ày 

образует ряд безусловного распределения значений полупериодов 
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У. Заметим, что Ур; = E 
j=1 
Суммируя частости р, по столбцам (по j) табл. 3.3.13, опре- - 
делим безусловные частости р;, вместе с совокупностью интерва- 
лов группировки Ах образующие ряд не: распределения 


значений амплитуд Х; очевидно, что. ` pror, 
{= < 
Пользуясь методом, рассмотренным в $ 8.1, можем определить 
частости кумулятивной призмограммы совместного распределе- 
ния Py (X < z, У = у), суммируя для любой пары значений 
ти/, все частости Pij, расположенные слева и сверху от искомой 
и на ее месте, например, 


Pij (Х =45, ве 005 - 0, 005 + 0,005 +0, 005--0,066 -+ 0,005 = 
= 0,091. 


Напомним, что «граничные» слева, снизу частости 


Ри (X < tp У = у) = pi (X = я), 
а «граничные» справа, сверху частости 
Ри (Х = хх, Г=<у) =р,(У = Yi): 
как показано в табл. 3.3.14. 
Безусловные средние арифметические значения определим, вы- 


числяя тх и ту по способу произведений через безусловные эмпи- 
рические вероятности Е 3.3.13): 
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Таблица 3..8.13 


Частоты (p;j) совместного распределения полупериодов (у) и амплитуд (2) и промежуточные величины к расчету 
безусловных средних, дисперсий и коэффициента корреляции 


12 
— о о pi | È epera 


33 | —5 
40 | —4 | 0,005 | 0,066 | 0,005 | 0,005 0,081 | —0,324 | 1,246 
47| -—3 0,023 | 0,080 | 0,033 | 0,049 | 0,009 0,164 | —0,492 | 1,239. 
ВЕ 0,009 | 0,042 | 0,049 | 0,023 | 0,005 0,098 | —0,496 | 0,273 
64 | 4 0,005 | 0.037 | 0,033 | 0,023 | 0,014 | 0,014] 0,005 0,434 | —0,134 | 0,344 
68 | 0 | — | 0,014 | 0,023 | 0,033 | 0,028] 0,014] 0,044 0,126| 0,000 | 0,509 
Я 0,005 | 0,009 | 0,044 | 0,009 |- — | 0,049] 0,019] 0,044 0,089| 0,089 | 0,863 
Во |9 0,005 | 0,005 | 0,005 | 0,049] 0,005] 0,042] 0,0541 0,005] 0,437 | 0,274 | 2,258 
8,9 |3 0,005] 0,005] 0,0141 0,0541 0,044] 0,089 | 0,267 | 2,068 
9,6 | 4 0,009] 0,005] 0,0051 0'005| 0,024 | 0,096 | 0,466 
10,3 | 5 0,009] 0,009] 0,009] 0,027| 0,435 | 0,693 
110 | 6 | 0,005] 0,009] 0,005] 0,049| 0,414 | 0,485 
Pi 0,010 | 0,094] 0,104] 0,422| 0099| 0,097 | 0,066] 0,066] 0,057|/0,408] 0,139] 0,038] 1,000] —0,243 | 10,694 
zýpi . |-0,050 |—0,376 |—0,312 |—0,244 |—0,099 | 0,000 | 0,066] 0,432] 0,171] 0,432| 0,695] 0,228] 0,643| Ay =15 мм 
12 | 
У W) pia | 0,205] 1,388| 0,966] 0,587| 0,309| 0,230 | 0,063] 0,435] 0,233] 0,798] 1,306] 0,634] 6,851 hy =0,7 мм 
j-i 
12 ) ; | 
Узи :ры| 0,225| 1,432| 0,924 | 0,470| 0,409| 0,000 |--0,005] 0,078] 0,225] 0,960] 1,940] 0,882] 7,240 Ay =90 мм 
PA 


Ay mrema 6,8 MM 


0,005 | 0,005 | 0.005 0,015 —0,075 0.250 ° 


vy у 
а 
ма 

и 


Таблица 3.3.14 


Частоети р;;(Х = 1, У = yj) кумулятивной призмограммы совместного распределения 
и частости кумузятивных гистограмм безусловных распределений к примеру 3.3.4. 


x; 15 30 45 60 75 90 105 | 120 135 150 165 180 |p <y) 
Yj 

33 10,005 | -0,010 | 0,015 ии | | 0,015 
40 {0010| 0,084 | 0,094 | 0,096 | 0,096 
4,7 0.404 | 04194 | 0232 | 0254 | 0260 |. 0,260 
5,4 0,203 | 0,283 | 0,324. | 0,353 | 0,358 | 0,358 
6,1 a 0,208 | 0,325 | 0,396 | 0,454 | 0,470 | 0,484 | 0,489 | | 0,489 
6,8 = | 0,325 | 0,410 | 0,488 | 0,540 | 0,582 | 0,501 | 0,615 | 0,615 
75 | _ 0,330 | 0,424 | 0,546 | 0,577 | 0,619 | 0,657 | 0,690 | 0,704 0,704 
т 0,429 | 0,526 | 0,592 | 0,653 | 0,696`| 0,774 | 0,836 | 0,544 | 0,841 
8,9 0,658 | 0706 | 0,795 | 0,944 | 0,930 | 0,930 
9,6 | y 0,745 | 0809 | 0,930 |-0,954 | 0,954 
10,3 По 0,818 | 0,948 | 0,981 | 0,981. 
11,0 | | | | 0,823 | 0,962 | 1,000 | 1,000 


pi(X<z;)| 0,010 | 0,404 | 0,28 | 0,330 | 0,429 | 0,526 | 0,592 | 0,658 | 0,745 | 0,823 | 0,962 | 1,000 и 
> 


Проверка другим способом, по формулам (3.3. 126). и (3.3.136) по- 
казывает, что вычисления Ни Тогда по формулам (3.3.12а) 
n (3-8. 13a): | 

; _ М[Х] =90- 15: 0,643 ~ 99,6 (мм) 

и 


М [У1 = 6,8 — 0,7 -0,243 ~ 6,6 (мм). 


_ Безусловные дисперсии определим по формулам (3.3.15а и 6), 
используя суммы квадратов отклонений, приведенные B послед- 
нем Оооо и предпоследней строке табл. 3.3.13: 


D’ [X] = 10,691 — 0,643? ~ 10,278, 


О [Х] = 154 10,278 => 2312,55, 
откуда с [X] ~ 48,1: 


О’ [У] = 6,851 — (—0,243)? ~ 6,792, 
D [Y] = 0,72 -6,792~3,33, 
откуда o[Y] =~ 1,8. 
Для Foeta СОУ’ [ХУ] в последней строке табл. 3. 3. 13 при- 
ведены суммы 5 Ti Yi" Pij, So inii которые, по формуле (3.3.10) 


> ]=1 
ВвыЫЧчИСЛлИМ 


Тогда коэффициент корреляции определится по формуле (3.3.9) 


— А. ВЕН => 0,886, 
У 10,278. 6,792 | 
и «линейная» оценка коэффициента детерминации: ль 0,785. 


По формулам (3.3.11) вычислим оценки киты. линий 
регрессии: 


. 07.1396 _ 
бк — 15. 10,278 ~ 0034, 


| _ 15.7,396 

к | ах = 25 29,3 
Te | xiy 0,7. 6,792 

Теперь займемся вычислением частостей условных распределе- 
ний, условных средних, линий регрессии и корреляционных отно- 
шений. Условные законы распределения У по Х заданные часто- 
стями 2Й, представлены в табл. 3.3.15. Условные законы pac- 

Pi 


пределения X по У, ‘заданные частостями 5 ‚ представлены 
в табл. 3.3.146. В этих же таблицах приведены промежуточные 
величины, необходимые для расчета условных средних, дисперсий 
условных средних и остаточных дисперсий. По формулам (3.3.14а 
и 6) и табл. 3.3.15 и 3.3.16 вычислены условные средние М (z/y;) 
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ra 


Stg 


+ Pij di 
Условные чаетости Вт значении у; при условии, что появились значения Tj 
i ; 


и промежуточные величины к расчету 1, , 


Таблица 3.3.15 


3,3 AB 0,500 | 0,053 | 0,048 

4,0 —4 0,500 | 0,702 | 0,048 | 0,041 

4,1 -3 0,244 | 0,769 | 0,270 | 0,492 | 0,093 
5,4 + 0,087 | 0,344 | 0,192 | 0,237 
6,1 cna 0,048 | 0,303 | 0,333 | 0,237 
6,8 0, aa 0,444 | 0,237 
7,5 1 0,044 | 0,094 | 0,144 
8,2 2 0,050 | 0,052 
8,9 с: 

9,6 4 | 

10,3 5 

11,0 6 


t pik" 
\` į —=S |— 4,500 | —3,805 | —2,961 | —1,924 | —1,102 | —0 742 
РР ы Piwi ея | 


]=1 
52 20,250 | 14,478 8,768 3,702 1,214 0,551 
Pi 0,010 0,094 0.104 0,122 | 0,099 0,097 
52. р; 0,202 1,361 | 0,912 0,452 0,120 0,053 


0,076 
0,212 
0,500 
0,136 
0,076 


—0,076 


0,006 
0,066 
0,000 


2,217 


4,915 
0,108 
0,581 


2,195 


7,812 
0,139 
1,086 


5,873 


15,000 
0,038 
0,570 


97с 


Pi и Е | 
Условные частости —— значении Ti при условии, что появились значения Ур» 


Таблица 3.3.16 


j 
и промежуточные величины к расчету nè, 


у 4,0 4,1 5,4 6,1 7,5 8,2 8,9 9,6 10,3 11,0 
xi жж и —5 —4 —3 —2 —1 0 1 2 3 4 5 6 
15 о 0,333 | 0,064 
30 ей 0.333 | 0,845 | 0,440 
45 в 0,333 | 0,062 | 0,488 | 0,092 | 0,038 
60 р 0,062 | 0,204 | 0,429 | 0,282 0,056 
75 sai 0.116 | 0,194 | 0,252 | 0,144 | 0,104 | 0,036 
90 AO 0.055 | 0,234 | 0,476 | 0,183 | 0,457 | 0,036 
105 т 0,054 | 0,407 | 0,262 | 0,404 | 0,037 
120 2 0,106 | 0,222 ре: 0,439 | 0,056 | | 
135 3 0,038 | 0,144 | 0244 | 0,037 | 0,056 | 0,375 
150 4 | 0444 | 0,244 | 0,306 | 0,457 | 0208 | 0333 | 0,263 
165 5 0,157 | 0372 | 0,573 | 0,208 | 0,333 | 0.474 
180 6 _| 0.037 | 0,457 | 0,208 | 0,333 | 0,263 
12 T . 
s- Ут" —3,996 | —3,875 | —2,542 | —4,277 | —0,497 | 1,372 | 2,474 | 3,696 | 4,745 | 4245 | 14,995. | 5,000 _ 
м“ 15.968 | 15.043 | 6.462 | 1634 | 0,247 | 1882 | 4743 | 13,660 | 22.234 | 18,020 | 24,950 | 25,000 
Pj 0,015 | 0081| 0,164 | 0,098 | 0,134 | 0,426 | 0,089 | 0,437 | 0,089 | 0,024 | 0,027 | 0,019. 
S2. pj 0240| 121461 1060 | 0460 | 0,032 | 0,237 |’ 0,449 | 1,874 | 1,979 | 0,432 | 0,674 | 0,475 


3,3 


Таблица 8.8.17 
Условные ередние арифметические значения 


Регрессия У по Х | `Регрессия X по У 
+i M (у/х;) Yj M (</и;) 
я 
145 3,6 3,3 31 
30 4,1 4,0 32 
45 4,7 4,7 52 
60 5,4 5,4 71 
75 6,0 6,1 82 
90 6,3 6,5 111 
105 6,7 e As 123 
120 na 8,2, 145 
135 7,7 8,9 ~ 161 
150 8,4 9,6 154 
165 8,7 10,3 165 
180 9,5 14,0 165 


Примечание. Значения M (y/x;) округлены до. де- 
сятых, а М (2/у;) — до целых в соответствии с точностью 
измерения полупериодов и амплитуд. 


и М (у/2;), которые сопоставлены значениям у, ид; в табл. 3.3.17 
и`на рис. 3.3.6. 

Определим коэффициенты линии регрессии Y по X графоанали- 
тическим способом. При X = 0 с графика (рис. 3.3.6) получаем 
by ~ 3,1. Далее: 

Ау — 95—31 


арк = АР 20,035. 


Совпадение с ах, вычисленным через ковариацию, хорошее. 


Можем принять уравнение у = 0,035 -+ 3,1 в качестве оценки 
теоретической зависимости средних полупериодов от амплитуды 
колебаний. Так как точки М (5/у;) на рис. 3.3.6 не образуют «хо- 
рошей» прямой линии, коэффициенты линий регрессии Х по У 
вычислим по методу наименьших квадратов. Нормальные уравне- 
ния в явном виде следующие: 


_ 1292 = 85,8 -@«и-- 12-6, - | 
10650,4 = 683,54 - axı; + 85,8 -bx J` 


Приближенные вычисления дают такое решение системы Ayjy == 
a 21; 6х ~ —42, которое удовлетворительным образом соответ- 
ствует вычисленному через ковариацию значению а,,,. Однако 
следует считать значение QAyjy œ~ 23,5 более точным * и заново 
определить by: Ра 


bx =- (1292 —85,8.23,3) ~ — 59. 


* Оно получено в результате более короткой цепочки вычислений. 
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X 


Таким образом, в качестве линейной оценки теоретической зависи- 
мости амплитуды колебаний руки от полупериода принимается 
уравнение Е. | 


r= 93,3y — 59: 
a | | 
м 
62 
6,8 


54 


r K E 90 120 150 , 180 


Рис. 3.3.6. Регрессии условных средних к примеру 3.3.4. 


По оси ординат — полупериоды (у); по оси абсцисс — амплитуды (х). 
Крестики — значения М (у /х;), точки — значения М (х/у;) по таб- 


лице 3.3.17. Графоаналитическим способом получена линия регрессии 
y = 0,035х + 3,1 (линия, соединяющая крестики). 


\ 


Остается вычислить коэффициенты детерминации X по Уи У 
по Х икорреляционные отношения. Сначала по формулам (3.3.16 — 
3.3.17) и промежуточным величинам из табл. 3.3.13, 3.3.16 и 3.3.17 
рассчитаем необходимые дисперсии: 


D’ [М (2/у;)] = 8,795 — 0,413 = 8,382, 
Do [z/y;] = 10,691 — 8,795 = 1,896; _ 
D’ [М (9/2) ] = 5,409 — 0,059 = 5,350, 


Оь[у/х1 = 6,851 —.5,409 = 1,442. 
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Проверяя равенства 
PTE IM (z/y)] + 2% iz/v; = 10, 218 


D' [Y]=D' [M (y/z)1+ Рева =6,792, — | 
убеждаемся в правильности вычислений. Окончательно находим 


c 0808 
nsu = 10278 — 1 — 90278 Y O 816; п„„=0,903; 


5,350 1,442 
_ Пя l 5792 220,188, ти» = 0,888. 


_ Сопоставляя с r? = 0,785, можно видеть, что корреляция в pac- 
сматриваемом случае почти не отличается от линейной. 


——— 


Глава 4 


КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ 
МНОГОМЕРНОЙ СИСТЕМЫ. СЛУЧАЙНЫХ ВЕЛИЧИН 


< 


$ 4.1. МНОГОМЕРНЫЕ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН 
И ИХ КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ 


_ 4.1.4. Понятие о многомерной системе 


N случайных величин, рассматриваемых совместно, образуют 
И-мерную систему случайных величин. При N >> 2 обычно гово- 
рят о многомерных системах. 

Пусть случайные величины X4, Xa, Х., ..., Хр... Хм-ь 
Хк 1 =1, 2,..., №) образуют систему. Тогда в каждом испы- 
тании совместно реализуются (или рассматриваются) N значений: 
Xis Zo, ...Хь..., TN-1, ZN, Каждое из области определения 


Рис. 4.1.1. Геометрическая HH- 
терпретация трехмерной системы. 


Случайные величины Х,, Xs, X, изоб- 
ражены осями прямоугольной системы 
координат. А — реализация случайной 
точки. Áis — проекция А на плоскость 
Х,ОХ,, аналогично Á; и Аз — проек- 
ции А на соответствующие плоскости 
Х,ОХ.и Х,ОХ.. «Тройка» значений (x, 
Xə, хз) однозначно определяет поло- 
жение точки А в трехмерном простран- 


-J 
стве. ОА — реализация случайного 
> -> -> _ 
вектора; ОА!., ОА: и ОА,: — проекции 


— 
ОА на соответствующие плоскости. Так 
как направление и величина вектора 


точки А, то ее координаты (Xi, Xə, хз) 
> 
суть и координаты вектора ОА. 


Xo 


“e 


соответствующей случайной величины Х;. Такую совокупность 
из М значений z; можно рассматривать как координаты реализа- 
ции случайной точки А в М№-мерном декартовом пространстве. 
Если соединить точку А с началом координат, то совокупность 
значений z; (i = 1, 2, ..., №) может рассматриваться как COBO- 
купность координат проекций реализации случайного вектора 


ре 
ОА на координатные оси. 
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= 
ОА однозначно определены положением ^ 


> 


Таким образом, М№-мерная система случайных величин интер- 
претируется как случайная точка в гиперпространстве,* либо 
как случайный М-мерный вектор и задается списком своих реа- 
лизаций **, каждая из которых определена совокупностью из № 
проекций Z4, х.,..., хм на координатные оси. Пример реализа- 
ции случайной точки и случайного вектора в геометрической 
интерпретации для трехмерной системы дан на рис. 4.1.1. Заметим, 
что рассмотренные в предыдущей главе двумерные системы — 
простейший случай многомерных систем (при N = 2) — интер- 
претировались нами в виде случайной точки на плоскости («поле 
корреляции» на рис. 3.3.4) и задавались списком из Nn пар значе- 
ний Z, у. 


4.1.2. Разновидности многомерных систем 


Среди всевозможных многомерных систем для психологических 
‘приложений важно выделить: 1) системы однородные и разнород- 
ные; 2) неслучайные и случайные функции случайных величин. 

Однородные (гомогенные) системы образованы однородными 
случайными величинами. В любой отрасли психологии, осущест- 
вляя совместный анализ наличия или степени выраженности ка- 
кой-либо психической переменной X у группы из № индивидов, 
п-кратно измеряют у каждого индивида проявление этой пере- 
менной. Тогда, если обозначить психическую переменную 1-того 
индивида как Х,, получаем М№-мерную однородную систему, KO- 


торая задана списком из N-n значений z; (1=1,2,..., № 
и а 
Til?» T19, .. у) Liis В. TIN, 
Фот, Хэ, . o e3 Фор, ®. S, Том; 
Ti 1? Tiz . o %9 Тур ее ® ум, 
\ 
Фит; Tn 29 . o o9 Tni! ‚о o9 Лим. å 


Неоднородные (гетерогенные) системы образованы случайными. 
величинами, природа которых различна. Они имеют место при 
совместном изучении разных психических явлений как у отдель- 
ных индивидов, Так и у популяции. Например, совокупность 
гипотетических черт личности представляет собой в указанном 
смысле гетерогенную систему случайных величин. 


* Гиперпространством называется М№-мерное пространство при N œ> 3.- 
Гиперпространство нельзя изобразить в наглядной геометрической форме. 
Поэтому многомерные системы изображаются в аналитической или таблич- 
ной форме. 

** Реализация случайной точки (случайного вектора) — это не случай- 
ная точка (вектор), полученные в результате опыта при некотором комплексе 
существенных условий (рис. 4.1.1). 
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Разделение многомерных систем на однородные.и неоднородные 
важно по двум обстоятельствам. Во-первых, для однородных систем 
имеют очевидный физический. смысл операции суммирования 
отдельных величин, входящих в систему, тогда как для неодно- 
родных систем эти операции очевидного смысла не имеют.* В этой 
связи при создании и интерпретации многомерных психометри- 
ческих шкал возникают известные трудности, преодолеваемые 
отчасти специальными приемами, вроде нормализации по составу, 
рассмотренной выше, с отображением всех разнородных пере- 
менных в некоторую однородную, так что в результате неодно- 
родная система отображается в эквивалентную однородную си- 
стему.** Во-вторых, для однородных систем хорошо разработаны 
основы и приложения выборочного метода, тогда как для неодно- 
родных систем выборочный метод развит недостаточно (см. главу 5). 

Как и двумерные, — многомерные системы могут быть обра- 
зованы независимыми и зависимыми случайными величинами. 
Если отдельные случайные величины в многомерной системе зави- 
сят друг от друга (попарно и/или в совокупности), то рассмотрению 
подлежат неслучайные и случайные функции. хз 

Неслучайные функции от случайных величин (случайных аргу- 
ментов) называются множественными регрессиями (корреляцион-. 
ными уравнениями). Парные регрессии, рассмотренные выше, — 
это частный случай множественных регрессий. Наиболее распро- 
странены суммы и произведения случайных величин, а также их 
комбинации. Независимо от вида, регрессии — это всегда детер- 
минированные функции случайных аргументов, т. €. способ связи 
задан однозначно, поэтому их и называют неслучайными функ- 
циями от случайных величин. | 

Случайные функции (в отличие от неслучайных) — это случай- 
ные способы связи случайных (или неслучайных) переменных.*** 
Случайной называется функция, которая в конкретном испытании 
принимает значение из множества возможных функций, заранее 
не известно, какое. 

Для пояснения здесь уместно провести аналогию с определе- 
ниями случайного события и случайной величины. Случайное 
событие в опыте принимает значение из множества исходов (не- 
пересекающихся классов). Случайная величина принимает ano- 
стериори значение из множества числовых значений (из области 
определения). Случайная функция в результате опыта реализуется 


* Нельзя непосредственно складывать мужской пол и уровень интел- 

лектуального развития. | 

- ** Например, 11 разнородных психических переменных X; в шкале 
Векслера (тип WAIS) отображаются в 11 однородных переменных У;, Kak- 
дая из которых есть сумма баллов за выполнение $-того субтеста. 
_ _ *** Отметим, что в теории случайных функций неслучайные функции слу- 
чаиных аргументов рассматривают как разновидность случайных функций. 
При этом, однако, имеют в виду второй смысл термина «функция» — зави- 
симую переменную, которая всегда случайна, если случаен аргумент. 
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в виде неслучайной функции из некоторого класса функций, 
причем априорное множество непересекающихся классов функций 
можно рассматривать как область определения случайной функ- 

Рассмотрим один из распространенных способов задания слу- 
чайной функции в виде системы случайных величин. Пусть слу- 
чайная функция f (X) реализуется в п испытаниях, как показано 
на рис. 4.1.2, в виде n реализаций f; (X), где j = 1, 2,..., И. 
Тогда для каждого #-того значения аргумента X;(i = 1,2,..., N) 
имеем случайную величину f;(X;), заданную совокупностью зна- 
чений случайной функции, соответствующих значению аргу- 


AEA, 


Рис. 4.1.2. Представ- 
ление случайной фун- 
кции в виде системы 
случайных `величин. 
X į — аргумент, задан- 
ный дискретными значе- 
НИЯМИ * Е ть 
- М); 1, (Хр — значения 
случайной функции; — 

f: (X) — реализации слу- 
чайной функции; случай- 
ные величины образу- 
ются точками пересече- 
ния реализаций с nep- 
пендикуляром, восстано- 
вленным из Х;; fx м) — 
значение М№-й случайной 

величины. 


мента Х,. Рассматривая совместно М значений аргумента, полу- 
чаем систему из N случайных величин 


fi (X1) fi (Х,), Eees f; (X;), e. f; (Хм), 


каждая из которых принимает свои значения f;(X;) в j-TOM испы- 
тании. Можно видеть, что определенная таким путем случайная 
функция одного аргумента интерпретируется в виде однородной 
системы случайных величин. Неоднородная система должна рас- 
сматриваться как случайная функция Л неоднородных аргумен- 
тов. В общем виде изобразить такую функцию невозможно, так 
как ее реализации — это гиперповерхности, поэтому отметим 
лишь некоторые абстрактные представления такой функции. 
Случайная функция произвольного, но конечного числа раз- 
нородных аргументов, очевидно, может рассматриваться как сово- 
купность однородных систем случайных величин (по одной системе 
для каждого аргумента, как на рис. 4.1.2). Такая совокупность 
есть система случайных функций и, следовательно, ‘метасистема 
случайных величин. 
К понятию метасистемы можно прийти и от понятия неод- 
нородной многомерной системы. Действительно, неоднородную 
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систему всегда можно представить как систему однородных систем. 
С другой стороны, любая совокупность неоднородных систем, 
рассматриваемых вместе, образует метасистему. Специалистам — 
психологам, педагогам, социологам, врачам и т. п. нетрудно 
понять, что совокупность психических свойств, состояний, а тем 
более функций, изучаемая на множестве индивидов, gópasyor 
метасистему в рассмотренном смысле. 


4.1.3. Законы распределения в многомерной системе 


В многомерной системе, как и в двумерной, выделяются закон 
совместного распределения, безусловные и условные законы 
распределения. 

Закон совместного распределения значений /Л случайных 
величин (многомерный, М-мерный. закон распределения) является 
исчерпывающей количественной характеристикой М-мерной си- 
стемы. 

Функция (интегральная) М№-мерного распределения численно 
равна вероятности совместного выполнения неравенств 


Eia: ty -e anr A PHA есь 


Плотность М-мерного распределения (№-мерная_ плотность, 
плотность совместного распределения N случайных величин) 
численно равна 


Ре. 
а Фо e.s а еЕ с (4.1.2) 


где À; — ]-тый интервал квантования случайной величины Х', 
квантованной на j = Í, 2, ..., п, интервалов; Aog — А-тый HH- 
тервал квантования величины Х., квантованной на k = 1,2, ..., 
п. интервалов, и т. д.; Ах, — т-ный интервал квантования 


величины Хм, квантованной на т = 1, 2,...,.пм интервалов; 
Pko — вероятность совместного появления значений на Nepe- 
сечении № интервалов квантования Л1,, Aak» Ааа 
Для квантованных непрерывных случайных величин 
Е. m= P [(tı SX < + Аа) lta SX L -Е А)... 
. (хк=Хи< zy + Ам)|, (4.1.3) 


для существенно дискретных величин 
Pik ‚.. т=Р[(Х. =z) (X= 2) . .- (Xy = ty)] (4.1.4) 


и понятие плотности неприменимо. 
Соотношение между вероятностями (4.1.3), (4. 1.4) и интеграль- 

ной функцией в принципе такое же, как и рассмотренное для 

двумерной системы: 


17 72 XNm 
т У о А а. (4.1.5) 
]=1 k=1 m=i 
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где суммирование осуществляется для каждой {-той величины 
по всем интервалам квантования, включая заданный (7 Sui, 
К-тый ... Т-НЫЙ). 

Так как общее число пересечений интервалов квантования 


Nı Nə ny | N 
DADS фены. п, (4.1.6) 
j=1 k=1 m=1 i=1 ; 


и образует полную группу несовместных исходов опыта, TO, оче- 
видно, 


Оч, = 
причем 
п: Nə ny 
U rte Ри. o nmh. (4.1.7). 
j=1 k=1 m=1 


Безусловные законы распределения. характеризуют отдельные 
случайные величины, следовательно, безусловных законов в Х-мер- 
ной системе ровно IV, — столько же, сколько и случайных величин. 

Для каждой переменной X, интегральная или дифференциаль- 
ная функции безусловного распределения получаются из соот- 
ветствующих многомерных функций (4.1.1) и (4.1.2) суммирова-, 
нием (для квантованных и дискретных случайных величин) или. 
интегрированием (для непрерывных) вероятностей по всем осталь- 
ным переменным в области их наблюдения. Например, для кван- 
тованных переменных безусловные вероятности принять значения 


на интервалах Àj, Лоь, ..., АМт соответственно определяются. 
так: 
Nə RN ) 
P; = =P (X). e È Pie... т 
Nı ТМ 
P, =P, (X) =È... ar n (4.1.8) 
РРР a 
- ]=1А=1 j 


= 


М-мерную систему всегда можно разделить на части, выделив 
для 0собого рассмотрения любые А случайных величин (где 
1 = К = М — 1). Тогда К-мерный закон распределения, опре- 
деленный при условии, что остальные М — К случайных величин 
приняли фиксированные значения, является условным К-мерным 
распределением. 

Интегральные и дифференциальные функции ‘условных рас- 
пределений получаются из соотношений, связывающих условные 


15 г. B. Суходольский EPEA 


= 


и безусловные законы распределения с законом совместного рас- 
пределения, например: | 


| Е. ty) 
Elti ры 
Е (21) 

(4.1.9) 

F ar F (21, 0, в, Ty) 

(21/22, 22.2: №8 м) = F (22, ENA Fn , 
где F (£3, .. .p хм/х1) — условная функция распределения вели- 
чин Х., ..., Хм при фиксированном 21; Ё (51/1.,..., дм) — 
условная функция распределения, величины X, при фиксиро- 
ванных L3, д:,..., ХМ; Е (51, %.,..., мм) — М-мерная функ- 
ция распределения; F (£a, ..., хм) — N — 1-мерная функция 


распределения, F (zı) — функция безусловного распределения 
случайной величины Х |. 

Напомним, что как и для двумерной системы, уравнения 
(4.1.9) основаны на правилах вычисления вероятностей произве- 
дения событий, зависимых и независимых. Очевидно, что формулы 
_ (4.1.9) соответствуют случаю, когда случайные величины в системе 
зависимы. Именно в этом случае условные законы распределения 
отличаются от «своих» безусловных. 

В случае попарно и в совокупности независимых случайных 
величин все условные законы распределения тождественно равны 
‘безусловным законам, и справедливы . равенства: 


F (11,1)... пм) = F (11) F (23) . . . F (2N) 
fiip nea a n =] (51) 7 (2.)... (тю. 


Сравнивая формулы (4.1.10) и (4.1.9), можно видеть, насколько 
упрощает исследование многомерной системы независимость ее. 
компонент. Часто при отсутствии априорных сведений или просто 
для упрощения выкладок априори делают допущение о незави- 
симости компонент. Следует подчеркнуть, что многомерные ком- 
плексы психических явлений обычно взаимосвязаны, если не це- 
ликом, то частично. Поэтому для доказательства взаимонезави- 
симости или для выявления независимых и зависимых подсистем 
№-мерной системы требуются специальные исследования. 


(4.1.10) 


4.1.4. Чиеловые характеристики в многомерной системе 


Числовыми характеристиками законов распределения в много- 
мерной системе являются меры положения, рассеивания и связи. 

В качестве мер положения используются средние арифмети- 
ческие значения, безусловные и условные. Безусловные средние 
Mı, МЬ, ..., MN — можно рассматривать как координаты «центра 
тяжести» Л-мерной системы. Условные средние локализуют 
в М-мерном пространстве «центры тяжести» А-мерных подсистем. 

В качестве мер рассеивания используются безусловные и ус- 
ловные дисперсии, а также стандартные отклонения. 
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В качестве мер связи, наряду © уже рассмотренными мерами 
линейной и нелинейной парной корреляции, используются меры 
парциальной (частной, групповой) и множественной корреляции. 

Из перечисленных мер новизну представляют лишь меры связи, 
которые мы здесь и рассмотрим. В Л-мерной системе, как указы- 
валось, можно рассматривать любую часть К <N величин 
в связи с остальными М — К. Поэтому с точки зрения числа CBA- 
занных между собой переменных выделяют связь частную (груп- 
повую, парциальную) и множественную. И та и другая могут, 
вообще говоря, быть линейными или нелинейными по форме, 
взаимными или односторонними по направленности. 

Любая связь характеризуется мерами частной и множествен- 
ной детерминации, но линейная взаимная связь — мерами част- 
ной и множественной корреляции. Принято говорить о степени 
(порядке) частной связи, которая в простейшем случае парной 
связи называется «нулевой». В качестве мер частной детерминации 
нулевого порядка используются уже рассмотренные 112; /;, а в Ka- 
честве мер частной корреляции нулевого порядка — ковариации 
и коэффициенты линейной корреляции Пирсона rij, вычисленные 
для всех сочетаний по два из V переменных (парные). 

Сравнительная простота вычислений обусловливает преиму- 
щественное использование в психологических исследованиях имен- 
но ковариаций и парных коэффициентов линейной корреляции, 
хотя это может быть по существу и не обосновано.* Совокупности 
парных ковариаций и коэффициентов корреляции объединяются 
в матрицы, которые и характеризуют частные взаимосвязи нуле- 
вого порядка в Х-мерной системе. 

Ковариационная (корреляционная) матрица порядка. N oôpa- 
зуется значениями ковариаций и безусловных дисперсий, KAK по- 
казано в табл. 4.1.1. Нетрудно видеть, что ковариационная MAT- 
рица симметрична относительно главной диагонали, поэтому 
из общего числа М (N — 1) ковариаций различных только 
0,5 N(N — 1). 

Нормированная корреляционная матрица образуется путем 
нормирования ковариационной матрицы парными произведениями 
стандартных отклонений. В результате по главной диагонали рас- 
полагаются единицы, а остальные элементы — коэффициенты 
линейной корреляции Пирсона (табл. 4.1.2): 


О д. ЕТ 
я. = . OI ——— s 5 

1] Oi’ Oj , ( р) 
где СОУ;; — ковариация Г-той и ]-той переменных, о; и O; — без- 


условные стандартные отклонения. ** 


| * Отметим, что в частном случае М-мерного нормального распределения 
линейные меры исчерпывающе характеризуют взаимосвязи.. 

** Нормированная корреляционная матрица в психологических исследо- 
ваниях часто именуется таблицей интеркорреляций. В дальнейшем изложе- 
нии будем называть ее просто корреляционной. 
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Таблица 4.1.1 
Ковариационная матрица М-мерной системы случайной величины. 


г. 


Xo- 


y Xy 
Xi care Е ем: Fo O 
X: р» |... | COYa fie | COYan 
= в Ро. 
Хх, Йа 


Примечание. СОУ;; =D;. Так как COV; =COV;j, то порядок 
индексации одинаков во всей матрице. | 


Корреляционная матрица в прикладных исследованиях обычно 
интерпретируется геометрически либо в виде графа (в корреля- 
ционном анализе), либо в виде конфигурации векторов (в фактор- 
ном анализе, см. главу 7). 

Таблица 4.1.2 


Корреляционная матрица Х№-мерной системы 


Е | z 
Ат 1 r12 rii TiN 
X2 rı? 1 721 ToN 
X; rii e 1 TiN 
Хх -TiN Toy aS TiN | Ea 1 


Корреляционным графом назовем совокупность из № вершин, 
обозначающих переменные и соединенных попарно линиями 
(ребрами), обозначающими факт корреляции между парами пере- 
менных и =, =... № ве. Так. 
для трех случайных величин корреляционный граф изображен 
на рис. 4.1.3. Сверху (или снизу) ребра надписывается значение 
rij- Разновидностью корреляционных графов являются корреля- 
ционные плеяды,* в которых длина ребер выбирается пропорцио- 


* П. В. Терентьев. Метод корреляционных плеяд. Вестник 
AFS: № 9. 1959: 
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нальной = положительная связь отображается сплошной, а OT- 
рицательная — пунктирной линией. Имеются и другие способы 
_ изображения г,; на ребрах корреляционного графа.* Здесь He- 
обходимо еще раз отметить, что коэффициент корреляции гу; 
отображает лишь факт совместной изменчивости {той и той 
переменных. Это значит, что при |r;; | > 0 либо сами переменные ij 
находятся в причинно-следственной взаимной связи, либо они 
причинно обусловлены некоторой другой переменной, входящей 
или не входящей в рассматриваемую систему.** Следовательно, 
ребра корреляционного графа можно лишь гипотетически трак- 
-товать в содержательном, а не формальном смысле. 


Рис. 4.1.3. Корреляционный 
граф к примеру 4.3.2. 


Вершины обозначают: 1— социомет- 
рический статус в группе; 2—нейро- 
тизм; 3 — эмоциональную экспан- 
сивность. Ребра обозначают корре- 
ляционную взаимосвязь. Значения 
парных коэффициентов корреляции 
взяты Из табл. 4.3.5. 


Коэффициенты линейной частной корреляции первого порядка. 
вычисляются через коэффициенты нулевого порядка и характери- 
зуют взаимосвязь между парами переменных при условии, что 
третья переменная приняла фиксированное ‘значение: 


Ее а, 
хитов ис 
И (1—4) (1—7) 


где г;; в — коэффициент частной корреляции первого порядка, 
характеризует линейную взаимосвязь 1-той и ]-той случайных 
величин, при элиминировании влияния А-той величины (индекс 
элиминируемой переменной отделяется точкой); ЕЯ = 
коэффициенты нулевого порядка; i # j # — номера перемен- 
ных в системе, принимающие значения от 1 до N. Вообще ко- 
эффициенты частной корреляции й-его порядка вычисляются по 


_ (4.4.42) 


* Л. К. Выханду. Об исследовании многопризнаковых биологи- 
ческих систем. В сб. Применение математических методов в биологии, 
вып. 3. JI., 1964. Ю.Н. Нешатаев. Корреляционный анализ видового 
состава фитоценозов лесосплавной дубравы «Лес на Ворскле». В сб. Приме- 
нение математических методов в биологии, вып. 4. JI., 1969. 

** А. М. Мандрыка. Математические методы и их применение 
в психотехнике. М.—Л., 1931; Ф.М. Бородкин. Статистическая оценка 
связей экономических показателей. М., 1968; Методика и техника статисти- 
ческой обработки первичной социологической информации. Под ред. Г. В. Оси- 
пова. M., 1968; H. С. Четвериков. О ложной корреляции. В сб.: 
Применение методов корреляции в экономических исследованиях. М., 1969. 
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= 


формулам, аналогичным (4.1.12), через коэффициенты частной 
корреляции hk — 1-го порядка. Например, _ 


Tiz за... (N-D. TIN. 34... (М-п "ГМ. за... (N) | 
ие - (4.1.13) 
( 1№М:34.... (№-1)) ( Гм. за... (№-1)) 


_ Универсальной мерой тесноты множественной связи является 
коэффициент множественной детерминации случайной величины 
X, остальными ЛМ — 1 случайными величинами многомерной. 
системы: 

2 Do Do 

1.23... М = D [ХА =í D [X;] ? (4.1.14) 
где Ву — доля дисперсии D [X;], обусловленная изменениями 
условного среднего арифметического значения М [X;] под влия- 
нием остальных N — 1 переменных, D, — доля дисперсии D [X;], 
обусловленная неучитываемыми в исследовании факторами. 

Остаточную дисперсию вычислять проще, чем факторную. 

Остаточная дисперсия для линейной корреляции может быть 
выражена следующим образом: 


D= D; z3.. N= Dr (f—r]a) и 2). . . (1—7. 23... (М1), 
(4.1.15) 


где 0;.2з...м — остаточная дзперсия 1-той случайной переменной, 
рассматриваемой в зависимости от остальных М — 1 величин; 
D; — безусловная дисперсия 1{-той величины; Tio, ..:0,..., 
7? N.23... (№1) — Квадраты коэффициентов частной корреляции 
возрастающего порядка. 

Подставляя (4.1.15) в (4.1. 14) и обозначая Ri. 23... N — коэф- 
фициент линейной детерминации, получим 


В}. 23... N= 1 — (1—7 a) (1—7. 3:4 (1 — ам. 23... (М-1)). 
(4.1.16) 


Величина В; 23... м=У В? 23... м называется коэффициентом MHO- 
жественной корреляции, который и характеризует степень линей- 
ной взаимосвязи 1-той случайной величины с остальными М — 1 
величинами в системе. Величины Ri, 23... м зависят от степени TeC- 
ноты взаимосвязи, от количества переменных в системе и от сте- 
пени близости анализируемых связей к линейным. В этой связи 
важно подчеркнуть, что. во-первых, всегда 


И и 


где ri; — наибольший из парных коэффициентов корреляции, 
а, во-вторых, низкая величина В; оз... м может свидетельствовать 
лишь об отсутствии линейной связи. Остаточную дисперсию и CBA- 
занные с ней меры 12.23...ми ВР.з...м можно определить и Apy- 
гими способами, которые будут рассмотрены ниже. 
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По аналогии с двумерной. системой можно ввести понятие 
коэффициента множественной индетерминации 
| 
R2 
1.23. —=1 R? 2з...м,. “. 1.17а) 
который служит мерой ее i-TOÏ случайной пере- 
менной в системе остальными № — 1 переменными и, следова- 
тельно, может характеризовать изменчивость 1-той переменной 
как обусловленную неконтролируемыми факторами (не включен- 
ными в систему). Очевидно, что мерой множественной акорреля- 
ции может служить коэффициент 


п e OTT, 23... М: о (4.1.176) 


Меры множественной корреляции, рассматриваемые тради- 
ционно, в сущности не характеризуют Х-мерную систему в целом. 
Фактически М-мерная система расчленяется на V таких подсистем, 
в каждой из которых 1-тая случайная переменная рассматривается 
как зависящая от V — 1 остальных случайных аргументов (см. 
$ 4.2). Такие подсистемы по отдельности и характеризуются 
мерами множественной связи. Таким образом, М-мерная система 
с точки зрения наличия в ней отдельных множественных связей 
характеризуется совокупностью в N мер. Однако возникает npa- 
вомерный вопрос о том, нельзя ли иметь одну меру, характеризу- 
ющую М-мерную систему в целом с точки зрения ее стохастической 
связности. 

Согласно общему определению стохастической независимости 
и зависимости величин, образующих М-мерную систему (4.1.10) 
и (4.1.9), можно рассматривать стохастическую связность системы 
как степень отличия всех вероятностей Р»...тш, фактически Ha- 
блюдаемых, от вероятностей Р*;,...т, теоретически ожидаемых 
в предположении о независимости величин (4.1.10): Тогда в ка- 
честве меры стохастической связности системы можно использо- 
вать коэффициент сопряженности Чупрова (1.3.29), видоизменяя 
его следующим образом: 


д Я e ny 
5y У РР 
а а 
т ya A T aa М 


VL+2—t—g 
где Ах — коэффициент связности №-мерной системы (в числителе 
_под радикалом записана величина отношения Y? к числу наблю- 
y2 


дени й: а 


z определенному после группировки дан- 
1=1 k=1 т=1 

ных); L — общее число пересечений интервалов квантования пере- 

менных V4, Ne, . . ., NN, определенное выше формулой (4.1.6); ta g — 

соответственно число строк и столбцов в группировочной таблице 

(см. табл. 4.5.2), так что t-g = С. Для конкретной системы, 
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ра 


заданной в табличной форме, Ги # можно определить численно, 
и тогда формула (4.1.18) упрощается: 


р в 
5y Peo m Eh m 


as peg k=1 ; ; 4. 9 
Si 0—1 г 


raer =1,2,..., t — номера строк и k = 1,2,..., g — номера 
столбцов группировочной таблицы, присваиваемые вне всякой 
связи со значениями уровней квантования переменных. 

Величина KẸ может быть названа коэффициентом совместной 
детерминации, в отличие от коэффициентов множественной детер- 
минации вида 17. 2з3...м . Поскольку стохастическая связь не ис- 
черпывается корреляцией, всегда справедливо: 


= аз... № (4.1.20) 


ГДе NË. 23... y — наибольший из всех коэффициентов множествен- 
ной детерминации. 


$ 4.2. НЕСЛУЧАЙНЫЕ ФУНКЦИИ ОТ СЛУЧАЙНЫХ АРГУМЕНТОВ 


В общем виде неслучайная функция от М случайных аргу- 
ментов записывается так: 


а (4.2.1) 


где ф — некоторая линейная или нелинейная функция, Чаще всего 
это простая сумма 


М 


i=l 
или (линейное) уравнение гиперплоскости 


z 
У = ХаХ а | (4.2.26) 


i=1 


или (нелинейное) уравнение гиперповерхности, в которое, по- 
мимо (4.2.26), аргументами входят произведения случайных ве- 
 личин по два, по три, по N, а иногда и степени отдельных вели- 
чин. Однако, так как вторые и тем более высшие степени трудно 
истолковывать, а число произведений переменных быстро увели- 
чивается при увеличении М, то стремятся использовать суммы 
(4.2.2а и 4.2.26)... 
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4.2.1. Jasorat характеристики суммы и произведения ее 
величин 


Среднее арифметическое суммы случайных величин Х,,Х.,..., 
Xn равно сумме средних арифметических от слагаемых: 


N N 
M È x, = УМ ХИ, (4.2.3) 
где #=1, 2, ..., М — номера слагаемых. 

Дисперсия суммы случайных величин равна сумме всех эле- 
ментов ковариационной матрицы: 


D È x, |= хх COYV;;, a (4.2.4) 


i=1 1=1 ]=1 


_ где СОУ;, — парные ковариации, #=1,2,..., №; ]=1,2,..., N. 
Так как COV; = D; и для независимых случайных величин 
все СОУ;, = 0 для j 7 i, то в частном случае независимых слага- 
емых имеем = | 


N N F те 
D 2 х. A DIX. (4.2.5) 


i=1 


Если величины X4, Xa, ..., Хм, образующие метасистему, сами 
являются суммами некоторых величин, то суммирование диспер- 
сий сводится к суммированию ковариационных матриц. При 
этом для независимых X1, Xo, ..., Хм ковариационная матрица 
суммы равна сумме ковариационных матриц слагаемых. 

Для независимых случайных величин среднее арифметическое 


произведения М случайных величин равно произведению средних - 


арифметических OT слагаемых: 


N N 
M È x, =H M [X;, (4.2.6) 
i= $=1 
в частном случае 
М [aX]=aM [X], (4.2.7). 


где а — константа. 

Для центрированных величин,* независимых в совокупности, 
дисперсия произведения равна произведению дисперсий сомно- 
жителей: 


N 0 N 0 
D È Я =H D [žl (4.2.8) 
= 1=] 


* Случайная величина называется центрированной, если задана централь- 


ными отклонениями: z; — М [z;]. 
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= 


0 ` 
где X;— центрированные величины. В частном случае 


ре is . у = 12. , 
а также AATE ARA (4.2.9) 


0 0 0 0 
D [Ax -X -Ay Y]= Axir О [XY], 


чем мы пользовались в предыдущей главе при вычислениях YUCHO- _ 
вых характеристик двумерной системы. $ 


4.2.2. Законы распределения линейной функции от случайных 
аргументов 


Простая сумма вида (4.2.2а) распределений независимых слу- 
чайных аргументов называется композицией (сверткой). Компози- 
ция легко определяется не для любых, а лишь для устойчивых 
законов распределения — закона Лапласа— Гаусса и гамма-рас- 
пределения.* 

Для нормального закона справедливо: 


если 
т и 
TO 
N 2 
= -2 M| | | 
ор 2] 
Vè oie V 2m 2%, o} F 
i=1 iml 


На композиции нормального закона основаны многие психомет- 
рические шкалы. В ‘частности, в шкале Векслера для взрослых 
сумма шкальных оценок субтеста — это композиция нормали- 
зованных предварительных оценок, а сумма шкальных оценок 
за группу вербальных (или невербальных) тестов — это компози- 
ция нормально распределенных шкальных оценок субтестов. 
Для гамма-распределения, аналогично, справедливо: если 


= а .11.ехр ( — В&,), 
то | 


(Г) =- 


Г“ 1. ехр ( — BT), (4.2.11) 


* Композиция а случайных величин имеет тоже 
гамма-распределение. 
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где 


1 < F 
р] A 
TDA a eS 

E | (4.2.12) 


М 
в=—^_ УМ (2). 
Ур (t) =- 


i=1 
Очевидно, что для экспоненциального распределения как част- 
вого случая гамма- распределения При. 9 —= 1 мы можем записать: 


7(Т) =Вехр (—В7), - < (4.2.43). 


где В определено уравнением (4.2.12). На композиции гамма-рас- 
пределения основаны возможности оценивать распределение за- 
трат времени на какие-либо рабочие или психические действия, 
расчленяемые на последовательно выполняемые простые операции. 

Закон распределения линейной функции вида (4.2.26) от 
нормально распределенных зависимых случайных аргументов 
имеет основное ИВР для многомерных психометрических 


шкал. Пусть X4, Х,,..., Хм — случайные величины с плот- 
ностями | 
i—M (z;)]? 
AEN E a т и, 
и пусть 
N 
У = ХаХ, 4. 
5-1 
Тогда 
N | 2. 
; о [Хам (æ+ ao) | | 
E ; .е БЕЯ НИЗ 5 РОЗА ai pi 
где 
N 
БУ] = F S a,- æ; COV ;;; 
| j=1 i=1 
а АЕ: E о ОА 


СОУ‚; для всех & включая $ = j — элементы ковариационной 
матрицы слагаемых; o [У] = VD [Y]. По формуле (4.2.14) об- 
разуются, в частности, оценки спортивных достижений в между- 
народных первенствах. Частным случаем (4.2.14) является закон 
нормального распределения суммы вида 


PLASA, (4.2.15) 


i=1 
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плотность которой 


ELAN 2 
> T 
i=1 


1 
ГУ) = Sir] 3 Vn exp | — 2) [7] TA ф 


где 
[У] =а?. У У COV; 
а © jalial 
для всех i Hj, 
o[Y] = VDF]. 
Такому распределению следуют оценки общего, вербального и не- 
вербального интеллекта в упомянутой шкале Векслера для взрос- 
лых. Например, общий козффищиент интеллектуального развития 
взрослых 


I Qo =0,6 у Х;- 6, 
i=1 
где X; — шкальная оценка за выполнение одного из NV суб- 
тестов шкалы; 6 — свободный член, параболически ое 
от возраста человека. 

Во многих практических случаях, лишь предполагая HOPMAN- 
ную распределенность аргументов, пользуются не самим распре- 
делением линейной функции Л аргументов, а его моментами — 
средними арифметическими, дисперсиями, ковариациями и коэф- 
фициентами корреляции, взаимосвязанными в так называемом 
корреляционном уравнении (регрессии). 


4.2.3 Множеетвенные линейные регреесии 


Как и для двух случайных величин, в М-мерной системе функ- 
ция, связывающая любые А случайных величин (К = 2,3, ..., 
№), называется регрессией. Принято выделять простую, частную, 
чистую и множественную регрессии. 

Простая (парная) регрессия связывает условные средние ариф- 
метические значения 1-той случайной величины CO значениями 
]-той случайной величины при всех наблюдавшихся значениях 
остальных Л’ — 2 случайных величин в системе. 

Частная регрессия связывает условные средние арифметиче- 
ские значения {-той случайной величины CO значениями K (при 
К =2,3,..., N — 1) других случайных величин при каких-то 
определенных (фиксированных) значениях остальных М — К 
случайных величин. 

Чистая регрессия — это разновидность частной регрессии 
для условий, когда остальные V — К случайных аргументов фик- 
сированы на среднем уровне. 

Множественная регрессия связывает условные средние ариф- 
метические значения одной из случайных величин со значениями 
всех остальных Л — 1 случайных величин. 
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Зная уравнение множественной регрессии, можно из него 
нолучить уравнение чистой регрессии. Именно эти разновидности 
чаще всего и используются в психологической практике. ` 

-~ По форме все перечисленные регрессии могут быть линейными 
или нелинейными. Из-за сравнительной простоты математического 
аппарата наибольший практический интерес для психолога пред- 
ставляют линейные регрессии.* В общем виде уравнение линейной 
множественной регрессии {-той переменной в развернутой форме 
записывается так: 


Ti. 23... М = lo. 23... N F lio, г Аь-В 


- Fais, 2... Ng Fe- FN. 23... N-1TN> | (4.2.1Та) 


ГДе 2; 23... м — условное среднее значение случайной величины 
_Х, соответствующее значениям Tə, Lz, ..., ZN, принимаемым 
остальными случайными величинами; а;23...м№, Qi3.2... N, 
а; №.23...№—1 — коэффициенты регрессии, смысл которых pac- 
смотрим несколько ниже; @0;.23...м — свободный член, показы- 
вающий, чему равен 21. 23...м, если все аргументы равны нулю. 
В сокращенной форме уравнение (4.2.17а) будем записывать так: 


М-1 


= 2 ах, aoi» (4.2.176). 


шт 


где все обозначения те же, что и в (4.2.17а). 

Коэффициент регрессии а;, показывает парциальное (частное) 
влияние ]-того случайного аргумента на {-тую случайную величину 
рассматриваемую в качестве зависимой ‚ переменной. При этом 
влияние остальных V — 2 случайных аргументов считается устра- 
ненным.** Например, коэффициент 412.з. показывает степень 
влияния случайной величины X, на случайную величину X, 
при устранении влияния X; M X4. 

Математический смысл коэффициента а;; для множественной 
регрессии тот же, что и для парной (простой регрессии), — это 
угловой коэффициент, равный тангенсу угла наклона проекции 
условных средних Ti, 23... N на плоскость Х;ОХ,. Однако содер- 
жательная физическая интерпретация Qj; как «веса» или меры вхо- 
ждения ]-той переменной в {-тую в буквальном смысле допустима 
только для однородных систем. Например, если все Х, — это 


-* Это, конечно, не означает, что нелинейные регрессии не должны при- 
меняться. Во многих случаях, когда требуется выявить точный теоретический. 
закон, именно нелинейные регрессии могут оказаться единственно подходя- 
щими для математической формулировки искомого закона. Но в начале 
исследования обычно достаточны линейные приближения. Кроме того, 
можно прийти к линейной регрессии, линеаризуя переменные. 

** На самом деле это не так, и коэффициенты а1. и Q13 в уравнении MHO- 
жественной регрессии Tı = ао: F aiglo + а1323 не равны, хотя и близки 
по величине аналогичным коэффициентам в уравнениях парных регрессий 
21 = вм rto И 21 = Ча F @152. 
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баллы, набранные индивидом за выполнение N — 1 заданий, 

а Х; — это сумма баллов, характеризующая общую успешность 
его достижений, то Qj; могут выражать степень трудности или важ- 
_ ности заданий, или оригинальности исполнения и т. п. 

_Иным является смысл коэффициента регрессии jj, если nepe- 
менные Ги j неоднородны. Здесь а;; есть мера направленного. 
влияния ]-той на 1-тую переменную, причем влияние понимается 
как стохастическая связь, в частном случае — как корреляция. 
При этом сами связанные величины могут быть количественными, 
количественными и качественными или только качественными — 
во всех случаях абсолютная величина |a; | характеризует сте- 
пень (силу) одностороннего влияния ]-той на 7-тую переменную, 
а знак (плюс или минус) — направление влияния (положительное 
или отрицательное, соответственно, как это было показано для 
двух случайных величин). 

Рассмотрим геометрическую интерпретацию /Л-мерной системы 
в регрессионном аспекте. 

Регрессионным подграфом 1-той случайной величины (i- тым 
регрессионным подграфом) будем называть совокупность из N 
вершин, обозначающих случайные величины, из которых каждая 
]-тая соединена с i-roñ (j # i) стрелкой (дугой), обозначающей 
парциальное влияние ]-той случайной величины на 1-тую; кроме 
того, пусть в #тую вершину «входит» дуга извне, что обозначает 
обусловленность 1{-той переменной внешними, не рассматривае- 
мыми в данной системе факторами (все множество таких факторов 
можно трактовать как NV + 1-ю вершину i-roro регрессионного 
подграфа). Над или под дугами внутри системы (таких дуг М —1) 
записываются значения коэффициентов 1-той множественной pe- 
‚ грессии. 

Около дуг, входящих в вершины извне (их N, по числу вершин) 
надписываются коэффициенты множественной индетерминации 


В? 3... y, характеризующие влияние внешней среды на каждую 
{-тую переменную. Регрессионные подграфы для случая трех 
переменных представлены на рис. 4.2.1, а, 6, в. В М-мерной cuac- 
теме, очевидно, имеется М 1-тых регрессионных подграфов, каждый 
из которых можно рассматривать как некоторое событие А,. 
Тогда систему в целом можно рассматривать как сумму совмест- 
ных событий Å}. 

`Регрессионным графом системы будем называть граф, получен- 
ный объединением всех регрессионных подграфов (рис. 4.2.1, г). 
Регрессионному графу соответствует несимметричная квадрат- 
ная матрица А, порядка М, внедиагональными элементами которой. 
являются коэффициенты множественной регрессии а;‚, а диаго- 


нальные элементы — это коэффициенты акорреляции В; 23. 

(см. табл. 4.3.6). По сравнению с корреляционным, регрессионный 
граф дает более обширную информацию oô изучаемой системе, 
так как «расщепляет» взаимосвязи между переменными до напра- 
вленных связей, характеризуемых различной силой влияния. 
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_ Как и для простой, для множественной регрессии угловые 
коэффициенты можно выразить в стандартной форме (в масштабе 
стандартных отклонений), нормируя соответствующие коэффи- 
циенты частной корреляции отношением стандартных отклонений. 
В общем виде имеем 


o: 
$. E NE ; 
Qij = Tij. 23 Е (4.2.18) 
y 1. a == 


ГДе т;; 23...м — коэффициенты частной корреляции Й-его mo- 
‘pajka, определенные выше формулой (4.1.13); о;оз... ми 
0; 23... № — условные стандартные отклонения -TOH и ]-той CHY- 
чайных величин, соответственно; эти отклонения получаются 
из дисперсий, определяемых по формуле (4.1.15), извлечением 
корня квадратного. | 


Рис. 4.2.1. Представление 
множественных регрессий 
на графах. 


а, бив — регрессионные NOg- 
графы социометрического ста- 
туса (1), нейротизма (2) и эмо- 
циональной экспансивности (3) 
соответственно; г — регрессион- 
ный граф системы этих nepe- 
менных (получается ‘«наложе- 
нием» своих подграфов). 


Коэффициенты множественной регрессии можно представить | 
иным образом: 


а; = Ви; k а | Е Е 
ири 
| ai nE NA o 
3 Pij = Tij. 28 N LIR , 24,2220) 


где В;; — стандартизованные коэффициенты регрессии (так назы- 
ваемые В-коэффициенты); 0; и о, — безусловные стандартные OT- 
клонения 1-той и ]-той случайных величин. Замена коэффициентов 
линейной множественной регрессии В-коэффициентами, в сущности, 
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означает переход от самих величин Х j К их основным откло- 
нениям: 


(4.2.21) 


в результате чего уравнение множественной регрессии вместо 
вида (4.2.17) приобретает вид 


Nai. 
Ti, 23... N = > Pitis (4.2.22) 
; а 


где свободный член а; отсутствует. 

Коэффициенты ß;; показывают, на какую долю своего стан- 
дартного отклонения O; изменится {-тая случайная переменная, 
если влияющая на нее ]-тая переменная изменится на Oj, а все 
остальные аргументы не изменятся. В качестве примера интер- 
претации множественной регрессии вида (4.2.22) приведем одно 
из так называемых уравнений «успешности», полученное Кэтте- 
лом * в результате исследований американских школьников (маль- 
чиков и девочек в возрасте около 12 лет): 


X =0,2X, + 0,5Х. +0,3X, —0,2X; —0,2X6 + 
+0,4X; + 0,2X; —0,2Х, —0,2Х 10 + 0,3X 41 — 0,1Х т», 


где Х, — школьные достижения в английском языке и арифме- 
тике; X> + Xi — полярно характеризуемые свойства личности 
школьников: X, — аффектотимия — шизотимия; X, — интеллек- 
туальность — неинтеллектуальность; X, — сила «я» — общая`эмо- 
циональность; X; — возбужденность — неуверенность; Хз — бес- 
печность — озабоченность, X, — совестливость (сила — слабость 
«сверх-я»); Х, — смелость — робость; Х, — мягкость — жест- 
кость; Хо — мечтательность — практичность; X 4; — самолюбие 
и самоконтроль; Х,. — напряженность потребностей — pac- 
слабленность. Очевидно, что при Q;; ==0 или, что то же самое, 
В;; = 0, линейное влияние X; на условные средние значения X, 
отсутствует, т.е. эти переменные некоррелированы (это не озна- 
чает отсутствия других видов стохастической связи). 

При изучении многомерной системы перед исследователем 
обычно могут возникнуть три задачи, различающиеся по степени 
проникновения в структуру связей переменных. | 

Первая задача состоит в том, чтобы установить факты связей 
и их направление. Решению этой задачи служит так называемый 
регрессионный анализ, который заключается в определении коэф- 
фициентов регрессии и анализе их статистической достоверности. 


* В. В. Cattell. The Scientific Analysis of Personality. Chicago, 
1966, pp. 310—312. 
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Развитием методов регрессионного анализа является так называ- 
емый дисперсионный анализ (глава 6). 

Вторая задача состоит в том, чтобы выявить факты парных 
взаимосвязей в системе и установить’ их достоверность. Решается 
эта задача вычислением ковариационной и интеркорреляционной 
матриц с их последующим анализом. 

Третья задача состоит в том, чтобы вскрыть глубинные груп- 
повые взаимосвязи (по три, по четыре и т.д. по №) между nepe- 
менными в системе. Решению этой задачи служат вычисление 
коэффициентов частной и множественной корреляции с последу- 
ющим исследованием их статистической достоверности путем 
так называемого корреляционного. анализа. Разновидностью кор- 
реляционного анализа является способ корреляционных плеяд.* 
Углублением и развитием идей корреляционного анализа является 
факторный анализ (глава 7). 

Основные идеи и методы регрессионного и корреляциовного 
анализа мы рассмотрим в главе 5. Здесь же изложим в общем виде 
процедуры определения необходимых числовых характеристик, 
которые далее подкрепим примером. 

В соответствии с тремя задачами можно вести исследование 
многомерной системы тремя способами. 

Первый способ сводится к вычислению непосредственно коэф- 
фициентов множественной регрессии по методу наименьших квад- 
ратов. Так как множественную регрессию можно построить для 
любой из NV случайных величин, считая ее зависимой от осталь- 
ных, то всего необходимо получить V уравнений: 


Ty =а0 + ал. +... Е азмтм, (4.2.23) 


Тм =а0ом FAN 121 т... Тамм м-1, 


в которых все коэффициенты а; и свободные члены Qo; могут 
быть различны как по значениям, так и по знакам. Чтобы найти 
неизвестные коэффициенты а;; и Ao; для каждой {той множествен- 
ной регрессии, необходимо построить и решить систему из № 
нормальных уравнений. 

В общем виде процедура получения системы нормальных урав- 
нений включает две операции, повторяющиеся М раз последова- 
тельно (j = 1, 2,..., №). Тогда ]-тое нормальное уравнение 
получается: 

1) умножением исходного уравнения {-той множественной per- 
рессии 


i =o mlio, F. o FANEN 


* П. В. Терентьев. Метод корреляционных плеяд. Вестник 
ЛГУ, № 9, 1959. 
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на 5, почленно: + 
т) = аи; - от)... мт, (4.2.24) 


\ 


причем, при j =i полагают <, == 1; 
2) уммированиом уаз (2.2. 24) почленно: 


ы т: a È Tit dia A FEREN Sni, (4.2.25) 

r=1 
где п — число Е (группами по N) значений случай- 
ных переменных; т = 1, 2,..., п — индекс наблюдения; при 


j = i, очевидно, Sas; = Nagi 
Ene 

В итоге получается метасистема из №? уравнений, решая KOTO- 
рые, можно определить все искомые коэффициенты и свободные 
члены множественных регрессий. Нетрудно понять, что уже при 
N = 4 приходится решать 16 уравнений, значит, для исследова- 
ния многомерных систем полезно использовать вычислительную 
’ машину. 

Бторой способ заключается в том, что первоначально вычи- 
сляется корреляционная матрица. Затем с помощью г;; строится № 
систем нормальных уравнений в В,,-коэффициентах (всего для 
-той множественной регрессии М — 1 нормальное уравнение).* 
решением которых определяются все P; Чтобы от стандартного 
перейти к натуральному масштабу, по формуле (4.2.19) надо вы- 
числить все а;,. Свободные члены не определяются через В-коэф- 
фициенты, непосредственно. Поэтому дополнительно составляют V 
уравнений вида 


N-1 E 
а =; — 2 ijti, (4.2.26) 
17 


где 2; и z; — безусловные средние арифметические случайных 
величин. | 

Третий способ — это вариант второго способа, дополненный 
вычислением“по формуле (4.1.13) коэффициентов частной Koppe- 
ляции первого и более высоких порядков. После этого по формуле 
(4.2.20) вычисляют В, коэффициенты, или непосредственно по 
формуле (4.2.18) — а; „-коэффициенты и по (4.2.26) — свободные 
члены. 

Отметим в заключение, что коэффициент множественной кор- 
реляции В ;.2з...м вычисляется при исследовании М-мерной 
системы по второму и третьему способу либо по формуле (4.1.16), 
либо через В,-коэффициенты — по формуле 


| N-I 
Ri a3. N= |, > Ви, (4.2.27) 


* Как это делается, рассмотрим ниже, в примере 4.3.2. 
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где все обозначения прежние. При использовании первого спо- 
соба можно оценить (без расчета r,; и В;;) коэффициент MHO- 
жественной детерминации по формуле (4.1.14), где остаточная 
дисперсия 


Do =4 У (ар — Ti a...n)? (4.2.28) 


Г==] 


и £i — наблюдавшиеся, а 21..3...м — вычисленные по множест- 
венной регрессии значения переменной X). 


$ 4.3. ОПРЕДЕЛЕНИЕ - ЧИСЛОВЫХ ХАРАКТЕРИСТИК. 
МНОГОМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН ИЗ 
ЭКСПЕРИМЕНТА 


4.3.1. Оценка вероятностей многомерного распределения 


Выявить М-мерную функцию распределения по эксперимен- 
тальным данным — задача весьма сложная. Во многих случаях 
ее можно обойти, ограничиваясь выявлением числовых и функ- 
циональных характеристик многомерной системы. Только в одном 
случае это невозможно — при планировании выборочного ис- 
следования из неоднородной совокупности (глава 5). В этой связи 
необходимо иметь хотя бы приближенные оценки вероятностей 
совместного появления всевозможных групи по М значений изу- 
чаемых переменных. 

Оценить вероятности Р;ь...т, смысл которых был раскрыт 
формулами (4.1.3) или (4.1.4), можно либо по данным специально 
организованного эксперимента, либо используя уже известные 
данные о безусловных и условных распределениях изучаемых 
переменных в популяции (например, статистику переписей). 
Специфика эксперимента, целью которого служит оценка вероят- 
ностей Pih ,. .m, состоит в совместной регистрации значений всех № 
переменных. Это отнюдь не легко, если учесть, что число совмест- 
ных наблюдений по формуле (4.1.6) быстро превышает любые 
практические возможности исследования. Уже при М >4 m 
n; > 3 целесообразно обращаться к демографическим данным. 
Однако при небольших системах можно организовать совместное 
наблюдение в эксперименте. Тогда процедура в общих чертах 
сводится к тому, что каждую переменную квантуют на двух, 
максимум — на трех уровнях, совместно регистрируют достаточ- 
ное для представительности оценок (см. главу 5) количество. 
реализаций в виде групи значений переменных, после чего 
распределяют их в таблице, как мы покажем ниже, в примере 
4.3.1. Š 

Если по каким-либо причинам исследователь решает оценить 
вероятности многомерного распределения, по льзуясь известными 
данными, то здесь нужно применять формулы (4.1.9) или (4.1.10). 
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Но использование формулы (4.1.9) связано со значительными 
расчетами, так как определить каждую вероятность Ру п уже 
для трех зависимых переменных можно шестью способами, ис- 
пользуя три безусловных и двенадцать условных вероятностей: 


Рут = Ру. Рьз-Ртл = P3 Ри; Priim = Ppr- Pip Pmjri = 


= Pp- Pmjr* Pijem = Ри-РуюРьт; =Ри-Рьт-Руть, . (4.3-1) 


где Pj, Pe, Pm — безусловные вероятности, a Pjr, Рувт и т. д. — 
условные вероятности. 

С другой стороны, применять формулу (4.1.10) — это значит 
допускать априори гипотезу о независимости случайных величин 
в совокупности, что весьма рискованно. В психологической прак- 
тике обычны случаи, когда системы образуются переменными, 
только часть из которых взаимозависимые. Поэтому в конкретном 
исследовании требуется, комбинируя формулы (4.1.9) и (4.1.10), 
сначала перечислить в общем виде способы определения всех 
вероятностей (4.1.3) или (4.1.4) и уже потом разыскивать данные 
об условных и безусловных распределениях,* которыми необхо- 
димо и достаточно воспользоваться для вычисления оценок Pik.. т 

Пример 4.3.1. В плане комплексного исследования личности 
от студентов [-го курса факультета психологии ЛГУ были полу- 
чены оценки социометрического статуса в своей учебной группе 
(Х!), нейротизма по Айзенку (X) и эмоциональной экспансив- 
ности (X ,), представленные в табл. 4.3.1. Несмотря на малочислен- 
ность данных (всего 42 человека), продемонстрируем оценивание 
вероятностей совместного распределения социометрического .ста- 
туса, нейротизма и эмоциональной экспансивности. 

Для группировки данных расчленим наблюдавшиеся значения 
каждой переменной на два уровня, как показано в табл. 4.3.2. 
Осуществляем труппировку, кодируя в пятиричной системе 
(как и прежде) палочкой факт появления события Ат, состоящего 
в том, что на пересечении ]-того, А-того и т-ного уровней (j = 1, 2; 
k = 1,2; т = 1,2) появится «тройка» значений X1, Xo, Xg Напри- 

мер, для первой в табл. 4.3.1 «тройки» значений [(X; = 1)(Х, = 18) 
-A =3)! имеем событие Asis == [(Х, = 11 AX; = х.2)(Х. = 
= 4:2)|, которое кодируем палочкой в соответствующей (правой, 
нижней) клетке табл. 4.3.2. Окончив группировку, подсчитываем 
частоты fjrm = ХАпи, суммы частот и оценки вероятностей 


Pihm = 5 fiim (см. табл. 4.3.2). Совокупность. этих оценок и Xa- 


рактеризует совместное распределение социометрического статуса, 

нейротизма и эмоциональной экспансивности у 42 студентов. 
Оценим, далее, степень стохастической связности системы, 

пользуясь коэффициентом совместной детерминации (4.1.19). Если 


* Именно таким путем была создана выборка в 1700 человек, положенная 
в основу шкалы Векслера (WAIS). | 
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ft 
ти. 
м. 


Таблица 4.3.1 
Исходные данные к примеру 4.3.1 


Х! х X: | Xs 


Хз 

1 18 3 8 7 —8 

—9 20 —15 8 5 18 

22 18 15 —2 17 4 

—14 22, —1 —28 12 3 

—6 9 —26 2 9 —1 

—0,5 12 11 i53 12 34 

13 2 —10 8 13 

9 16 KOE 4 9 9 

0 14 —4 19 - 3 12 

2 16 13 2 15 22' 

11 16 — 17 RRG. 14 29 

15 17 9 17 9 22 

—5 24 —27 7 14 7 

0 22 25 8 7 40 

9 7 61 4 13 40 

8 23 33 7 6 20 

15 44 —2 9 16 —50 

4 12 34 4 12 19 

—8 15 —4 0,5 20 AU 

—0,7 12 —6 8 12 0 

—15 13 —4 9 8 [224 
Суммы 140,3 | 555,0 Blao 


Обозначения: zı — социометрический статус в группе (%); 
z2 — нейротизм и 13 — эмоциональная экспансивность (в баллах) 
z A Таблица 4.3.2 
Определение оценок вероятностей Pjkm по данным эксперимента 
(Обозначения в тексте примера 4.3.1) 


на: < 13,5 #43 а > 13.0 
| 
X3 = Xa <0 | Хз = Хз 20 Ха = Xa < 0 X32 = Хз 20 
[|| | НИ | 
fi =3 [112 =3 121 =4 [122 =1 
zir =X <0 p11 = 0,07 P112 =0,07 p121 =0,10 p122 = 0,02 
Piu = 0,04 Piia = 0,10 Р1ол = 0,04 Роз = 0,08 
ИЕ ННИИНН | HU ATL 
= 7211 =3 [212 = 14 г [221 =3 [222 = 11 
а, >D P211 = 0,07 p212 = 0,34. p221 = 0,07 P222 = 0,26 
Рал = 0,13 P212 == 0,28 Раэл == 0,10 Раза = 0,23 
а 2 и. 2 > 2 2 
Суммы У; pä f ikm = 42; ра ро > Рут = > > Piem 1. 
7=1 k=1 m=1 1=1 k=1 т=1 1=1 В=1 Т=1 
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социометрический статус, нейротизм и эмонациональная экспан- 
сивность независимы в совокупности, то для всех j, kam должно 
выполняться условие 


№. 
Pinm = Ру; * Рк * Pm. 
Следовательно, вычисляя все оценки безусловных вероятностей 
по формулам (4.1.8) — результаты представлены в табл. 4.3.3, — 


можем далее определить и оценки рьш в предположении неза-. 
висимости переменных; эти оценки приведены в табл. 4.3.2. 


Таблица 4.3.3 


Безусловные эмпирические распределения величин социометрического 
статуса (Х1), нейротизма (X2) и эмоциональной экспансии (X3) 


для Xı | для Х2 для Хз 
Fij | | Pj e | Pk X3m Pm 
211 0,26 - zas 055 жа < 0,31 
212 0,74 122 0,45 T32 | 0,69 
с 2 | 2 
X p) 1,00 > Pr 1,00 pa | 1500 
j=1 k=4 mal 


Так как в группировочной табл. 4.3.2 t = 2 ив = 4, TO вы- 
полнив расчеты по формуле (4.1.19), получаем Ky ~œ 0,128 и 
Км > 0,36, что свидетельствует о наличии слабой совместной 
стохастической связи рассматриваемых переменных. Значит в прин- 
ципе имеет смысл определять и условные законы распределений; 
но это выходит за рамки нашего примера. 


4.3.2. Определение множественных регрессий и связанных с ними 
числовых характеристик 


Используем для демонстрации исходные данные предыдущего 
примера 4.3.1. Первый способ — непосредственный расчет коэффи- 
циентов множественных регрессий — требует составления трех 
систем по три нормальных уравнения в каждой. 

Пользуясь алгоритмом составления нормальных уравнений 
1-той множественной регрессии (стр. 241), составим их для per- 
рессии 

71. 23 = lor T 4127. - A1313. 
Умножая на 5х, = 1 исуммируя по числу наблюдений (г = 1,2, ..., 
42), получаем первое нормальное уравнение: | 


42 42 42 
>, Tı = 4201 + 412 2 2. | аз 2: 23. 


r=1 Г=1 Г=] 
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Умножая исходное уравнение на L, и суммируя, получим второе 
нормальное уравнение: 


5 71%. = lol > 2. F lio z 25 -|- а1з х 17273. 


r=1 


Умножая исходное уравнение Ha L, и суймируя, получим третье 
нормальное ‘уравнение: 


42 42 ' 
У 7173 = lol У L3 -F а12 > Laz -+ а1з >, 23. 
ral ral r=1 ral 


Аналогичным образом получаем и две других системы нормаль- 
ных уравнений, для переменных Ly и 5. соответственно: 


У т. = 42а» az у баз Zro | 
X T221 = lo X) T1 + aa XTi [аз У 217, 
х tety -=@ х T; + ал х т m У T3 | 
> хх. =4А2а: Раз 2 RATT F х го | 
X 2321 = lo У, £, Tla X Ti+ lsz X TiTa, | 
x Tts = lig х t, -+ аз1 у i2, + с», У ет | 


Чтобы определить все девять неизвестных (3 свободных члена 
и Ô коэффициентов множественных регрессий), необходимо по 
исходным данным (см. табл. 4.3.1) вычислить’ суммы значений 
каждой переменной, квадратов значений и парных произведений. 
Промежуточные значения и суммы квадратов и произведений 
представлены в табл. 4.3.4. Теперь можем записать в явном виде: 


140,3 = 42 аи +555 -а15 + 374 dis, 
1394,6 = 555 » ao + 8331 + а1. + 3969 - a43, | ДЛЯ Ti. 235 
3678,7 = 374 - axı +- 3969. a12- 20292. aiz Е 


595 =n 42, yi Aoz -|- 140,3 * az 374 a l3, 
1394,6 = 140;3 -a 14200 aE 3678,7 -а., | ДЛЯ -Za ra? 
3969 = 374 : а» + 3678,7 - а. + 20292 + аз 


374 = 42» Qo + 140,3 а. + 255. a33, 
3678,7 = 140,3 : aoz + 4290. azı + 1394,6. аз». | ДЛЯ 18.12. 
3969 = 555 - а з-- 1394,6. azı + 8331 - аз 
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T о 4.3.4 
Промежуточные переменные _ к раечету коэффициентов. множественной - 
регрессии, ковариаций и коэффициентов парной корреляции 


x? хз x$ Х:Х2 |Х1Хз | Х2Хз x? x3 l x3 XıXa f XıXs | X2zX3 
+ 32% 9 18 3 54| 64 49 64 56| —64| —56 
81 400 225 |—180 |135 |—300] 64 25 324 40| 144 90 
484 324 225| 396 |330 270 4 289 1| =34| —2 17 
121 484 1|—242 | 11 | —221 784 144 9 |-—336| —84 36 
.36 81 676 | —54 |156 |—234 4 81 1 о A T, 
0,25] 144 121| —6 | —5,5| 1321 225 144 | 1126 180| 5410| 408 
25 169 4 65 | 10 26| 100 64 169 | —80 |—130 104 
81 256 100] 144 | 90 160| 16 81 81 361-361-814 
0 196 16 0 0 | —561 364 9 144 57| 228|- 36 


4 256 169 За 26 208 4 225 484 30 44| 330 
{2f 256 289 | 176 |—187|—272|. 36 | 196 | 841 84| 174| 406 
225 289 81| 255 | 135 1531] 289 81 484 | 153| 374| 198 

64 441 729 |—168 | 216]—567| 49 196 49 98 49 98 

0 484 625 0 0] 5501 64 49 | 1600 56| 320| 280 


81 49 | 3721 63 | 549] 427| 16 169 | 1600 52| 460| 520 
64 529 | 10891, 484 | 264| 759| 49 36 400 42| 140| 120 
225 та 4] 465 | 309]. —22] 81 256 | 2500 | 144|—450| —800 


16 144 | 1126 48 | 136] 408| 16 144 361 48 76| 228 
_ 64. 225 "16 |—120 32| —60 || 0,25] 400 100 10 5| 200 
0,49 | 144 36| —8,4| 4,2] —721 -64 144 0 96 0 0- 
225 169 16 |—195 60] —52| 81 64 576 12| 216 192 


Суммы 4290,0! 8331,0]20292.04394.6]36787| 3969.0 


Решая эти системы уравнений любым известным способом, полу- 
чаем приближенные значения шести а, ; они приведены в табл. 4.3. 6) 
и свободных членов: 


ao ~ 6,73; do ™ 13,9; dog => 16,4. 
‘Tenepb можем записать искомые регрессии: 
21 3==6,73 —0,34х, — 0,124х.. 
£z. 13 = 13,9 — 0,095, — 0,0453, 
25—46 4+0, 55z;— 0, Tisy 


Заметим, что пользуясь найденными множественными регрес- 
сиями, можно определить коэффициенты множественной детерми- 
нации следующим образом: 


42 
1 
= В. >i (3—5), 


Г=} 
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где О; — безусловная дисперсия, определяемая обычным путем: 
42 


a =-5 =. и a Z; — наблюдавшиеся значения {-той Nepe- 
7-1 

менной; 1: — вычисленные по #-той множественной регрессии ожи- 

даемые значения 1-той переменной. 

Не вычисляя здесь величин n, отметим, что всегда n? => R}, 
где В? — коэффициенты линейной детерминации, определяемые. 
формулами (4.1.16) или (4.2.27). 

Но второму способу вычисления начинаются с определения 
значений элементов ковариационной матрицы, стандартных откло- 
нений, а затем и парных коэффициентов корреляции, причем 
используются те же самые суммы из табл. 4.3.1 и 4.3.4. Ре- 
зультирующие ковариационная и корреляционная матрицы 
и значения стандартных отклонений приведены в табл. 4.3.5. По 


Таблица 4.3.5 


Ковариацконная (a), корреляционная (6) матрицы, 

и безусловные стандартные отклонения переменных (в) 
первой выборки, из примера 4.3.1; корреляционная 
матрица (2) второй выборки (к примеру 5.2.5) 

Х: — социометрический статус на курсе, Х, — нейротизм, 

‚ Хз — эмоциональная экспансия, п-57 человек. 


Ki Хх,» Хз 
X 91.0 —41 4 58,0 
а Х2 — 441 24,0 —23,0 
r 58,0 ==23.0 404,0 
Ka Хо Хз 
Xi 4 — 0.238 0,302 
6 бе — 0.238 4 +0234 
X; 0,302 —0,234 1 
в o; 9,54 | 4:90 20.10 
| Х! Хх. | Хз 
Xi 1 =—0,276 0.162 
г X; —0,276 Е 1 —0,347 
к. 0.162 —0.347 1 
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корреляционной матрице построим корреляционный граф рассма- 
триваемой системы, он изображен на рис. 4.1 

Системы нормальных уравнений для вычисления В,;-коэффи- 
циентов получим следующим путем. 

1) Выберем из корреляционной матрицы подматрицу, удаляя 
строку и столбец той переменной, которую считаем зависимой. 
_ Так, для социометрического статуса (X) находим подматрицу (1), . 
для нейротизма (Х.)— подматрицу (2), а для эмоциональной 
экспансивности (X) — подматрицу (3): | 


1 Tas 1 Fiz 
ван (1); | я (2); = | (3). 


2) Сформируем для каждой из этих подматриц диагональ- 
ную подматрицу В;-коэффициентов (где i — номер зависимой 
переменной, j — номера независимых): 


Bis Ва В 0 
Г kd (1 р | (2); k aal ia). 


3) Перемножим слева подматрицы парных коэффициентов на 
соответствующие подматрицы р-коэффициентов, в результате 
получим 


О Biz  Гозаз o | Вы ГлзВьз _ [ Bar riba 
(1); (2); |. (3), 
ГозВ1> -Pis ГзВэ1 Bog ГоВза Взо 
где Bi = Вл; Bis = Вз: и Bog = Bgo так же, как и для парных коэф- 
фициентов корреляции. 
4) K каждой полученной подматрице слева, построчно, при- 
пишем через ‘знак равенства коэффициенты корреляции из уда- 


ленного ранее столбца, а элементы sioi от знака равенства 
суммируем: 


r32 = Bi + ГозВ1з la ri = Par + Г1зВьз | ); ris = Pai + Г1эВз2 
r13 = T23Pr2 + Влз : Гоз = T13P21 + Pos Tog == ГоРз1 + Ba 


Подставляя из исходной корреляционной матрицы значения Tij 
запишем системы нормальных уравнений в явном виде: 
— 0,238 = Bia —0,234В,з, |] 
0,302 = —0,234В;, | Виз ] 
0,238 = Вы, 20,3028: 
— 0,234 = 0,3028, + Bas, | 
0,302 = В», — 0,2388», _ 
—0;234 == — 0238p T Вы | 


| 


Решая эти системы, получим следующие приближенные значения 
В-коэффициентов: | 


в. —0, 184: ны o. TIR Pis = 0,261; 
Ps1 = 0,261; Pis rN — 0,179; В. = — 0,172. 


_ Можно видеть, что различия между «симметричными» В-коэффи- 
пен малы (эти различия вызваны округлением исходных 
г-коэффициентов). 

Вычисляя теперь по формуле (4.2.19) коэффициенты множе- 
ственных регрессий, получаем те же значения. (табл. 4.3.6). 
Далее, по формуле (4.2.27) определяем значения линейных коэф- 
фициентов множественной детерминации: 


В1. 2 == 0,121; 2. 13 œ 0,086; В3. 12 == 0,119, 


а по формуле (4.1.166) — коэффициенты множественной акорре- 
JANAH, приведенные на диагонали табл. 4.3.6. Изображая полу- 
ченные множественные регрессии в виде регресионных подграфов, 
как показано на рис. 4.2.1, а, Ő ив, можем затем объединить их 
в регрессионный граф (рис. 4.2.1, г), матрица которого дана 


в табл. 4.3.6 
Таблица 4.3.6 


Матрица регреесионного графа на pne. 4.3.2 _ 


Xix Xo SA Хз 
Xı R1.23=0,94 _ a12 =—0,34 a13 =0,124 
Хо 421 = —0,09 R2,43 = 0,96 _ @28 = —0,04 
Хз a31 =0,55 азо = —0,71 R3.12 = 0,94 


Третий способ дополняет проделанную работу вычислением 
коэффициентов частной корреляции. В нашем случае трех пере- 
менных по формуле (4.1.12) получаем 


Г12. 3722 —0,181; Г13. 2 == 0,261; Г.з.1 œ — 0,175, 


носле чего можем проверить найденные выше значения В; по 
формуле (4.1.16) и значения a; — по формуле (4.2.20) — вычи- 
сления правильны. 

Попытаемся теперь содержательно интерпретировать получен- 
ные регрессии и корреляции на качественном уровне. Корреля- 
ционный граф (рис. 4.1.3) показывает, что нейротизм отри- 
цательным образом взаимосвязан CO статусом и эмоциональ- 
ной экспансивностью, которые, в свою очередь, взаимосвязаны 
положительно. Во взаимосвязях, отображаемых Tij, однако, акку- 
мулировано влияние третьей переменной. Парциальные коэффи- 
циенты Tjj m «снимают» это влияние. Действительно, можем видеть, 
что каждая из переменных «усиливает» взаимосвязь двух остальных 
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(все г a Bor, пожалуй, и все, что можно сказать на 
основании 7,; ИГ, „, причем не более, чем в гипотетическом плане. 
Гораздо больше сведений нам дает регрессионный граф (рис. 


4.2.1). Во-первых, можно видеть, что взаимовлияния на деле. 


оказываются почти односторонними влияниями. Действительно, 
действия социометрического статуса и эмоциональной экспансив- 
ности на нейротизм столь малы по сравнению с воздействием ней- 
ротизма на эти переменные, что ими можно пренебречь. Нейротизм 
выступает как одна из причин, обусловливающих социометрический 
статус личности и ее эмоциональную экспансивность. Влияние 
социометрического статуса на эмоциональную экспансивность 
более, чем в 4 раза выше обратного влияния, что ` прекрасно 
подтверждает известное положение преимущественного обусловли- 
вания социального поведения социальным окружением. Заметим, 
что характер влияний в системе, вскрываемый регрессионным 
° графом, не выявляется отдельными регрессионными подграфами. 
Отсюда вытекает необходимость регрессионного исследования 
системы в ‘целом.. 

Представляет интерес оценка стохастической связности сис- 
темы рассматриваемых переменных, полученная в виде коэффи- 
циента совместной детерминации K; ~ 0,128. Заметим, что, 
действительно, совместная детерминация больше наибольшей мно- 
жественной детерминации, оцениваемой Ri.» => 0,124. Близость 
значений Аз и В10з, возможно, свидетельствует о хорошем 
приближении регрессий в системе линейными функциями. С дру- 
гой стороны, как отдельные переменные, так и система в целом 
более обусловлены извне неконтролируемыми ‘факторами, ‘чем 
изнутри — друг другом. Это’ позволяет предполагать, что 
социометрический статус в группе, нейротизм и эмоциональная 
экспансивность скорее входят в другие системы, чем сами 
образуют систему. Такое предположение вытекает и из малых 
величин коэффициентов парной корреляции, на которых основаны 
все остальные показатели. Но было бы неосторожным отбрасывать 
полученные сведения только на основании малости величин 7’, 
так как эти сведения не противоречат известным теоретическим 
положениям и экспериментальным фактам. 


$ 4.4. СЛУЧАЙНЫЕ ФУНКЦИИ 


4.4.1. Свойства и количественные характеристики случайных 
функций 


В начале главы было дано определение случайной функции 
как системы СНучАЙВЫЕ величин. Это не единственно возможное 
определение,* но мы ограничимся им при дальнейшем изложении. 

Случайная функция У (X), заданная на множестве п своих 


* Другие определения ПИН в специальной литературе (см. спи- 
сок литературы). 


эко 
29 


реализаций Yi 12 (где j = 1, 2, ..., п), принимающих значения 
Yj (=;) (rae i = 1, 2, ... N), на множестве V фиксированных 3Ha- 
чений x; аргумента X, либо значений интервалов квантования Àj, 
средними значениями которых выступают Tj, полностью опреде- 
ляется М-мерным законом распределения вероятностей Ру; di 
которые в принципе ничем не отличаются от вероятностей Р;, _ m» 
рассмотренных выше. 

Обычно для непрерывных аргументов число Л интервалов 
квантования, необходимое для изучения случайной функции 
У (X), должно быть порядка сотен и тысяч.* Поэтому в общем 
случае даже для случайных функций одного аргумента опреде- 
лить функции или плотность распределения не представляется 
возможным. Лишь для сравнительно редких видов случайных 
функций, как будет отмечено ниже, могут быть заданы законы 
распределения. В большинстве случаев приходится ограничи- 
ваться количественными характеристиками отдельных свойств _ 
многомерного закона распределения случайной функции. 

Случайная функция одного аргумента Y (Xy, реализации 
которой рассматриваются на плоскости ХОУ (рис. 4.1.2), характе- 
ризуется теми же свойствами, что и система случайных величин: 
положением, рассеиванием и связностью (асимметрия и эксцесс 
обычно не рассматриваются). Но в отличие от случайной величины 
или системы, эти же свойства у случайной функции выражаются 
количественно не с помощью числовых мер, а посредством неслу- 
чайных функций, образуемых мерами положения, рассеивания 
и связи от того же аргумента Х. 

Математическим ожиданием случайной функции У (X) Hasbi- 
вается неслучайная функция М[У (Х)]|, которая при каждом 
фиксированном значении аргумента 2; равна условному среднему 
арифметическому значению случайной функции M (y/zx;), опре- 
деленному для всех возможных реализаций У (Х). Таким обра- 
зом, математическое ожидание случайной функции — это рег- 
рессия условных средних «y по 4». Математическое ожидание 
случайной функции можно рассматривать как некоторую среднюю 
из возможных реализаций. 

Математическое ожидание случайной функции имеет те же 
свойства, что и среднее арифметическое значение суммы и про- 
изведения случайных величин (4.2.3), (4.2.6) и (4.2.7), только 
речь идет уже о суммировании или умножении не чисел, а функ- 
ций. Так, математическое ожидание простой суммы из А случайных 
функций одного и того же аргумента равно сумме математических 
ожиданий слагаемых: 


R R 
M Š УХ | =} M [Y, (X)|. (4.4.1) 


ар ПЕ. 


*А. Ф. Романенко, Г. А. Сергеев. Вопросы прикладного 
анализа случайных процессов. «Советское радио», М., 1968. 
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В частности, прибавление к случайной функции Y (X) неслучай- 
ной функции p (X) увеличивает математическое ожидание случай- 
ной функции на эту функцию: 


М [У (Х) + (Х)] = МУ (X+ p(X). ^^ (4.4.2) 


Это позволяет центрировать случайную функцию, вычитая из 
ее значений значения математического ожидания для тех °ке зна- 


«2 . o 0 < р 
чений аргумента. Центрированная случайная функция Y (Х) есть. 
функция центральных отклоне- 


y(x ) 5 ний, заданная на множестве зна- 


чений аргумента: 


У (Хх) УХ ЕМУ (Ху, 
Е № 
(4.4.3) 


X Умножение случайной ` функ- 
ции на неслучайную функцию 
того же аргумента p(X) увели- 
чивает математическое ожидание 


в ф (X) раз. 
М [$ (X); Y (X) = $(Х) М [У (X). 
(4.4.4) 


Рис. 4.4.1. Иллюстрация свойства Это свойство позволяет нормиро- 
связности случайной функции. вать случаиную функцию какой- 


а — сильно связная функция, ее из- либо неслучайной функцией, ча- 


менения медленны; 6 — слабо связ- ^ 
ная функция, ее изменения быстры. Щ@ Всего стандартным отклоне- 


нием. 

Дисперсией случайной функции У (X) называется неслучай- 

ная функция О [У (Х)], значение которой для каждого из значений 

аргумента есть условная дисперсия D (у/х,), определяемая также 
рассмотренными уже . способами. 

Среднее квадратическое (стандартное) отклонение случайной 

функции есть неслучайная функция o [У (Х)], значения которой 


для всех T; 
o [4/х = V D (у/2). (4.4.5) 


Очевидно, что D [У (Х)] ис [У (Х)] — это регрессии условных 
дисперсий и условных стандартных отклонений значений случай- 
‘ной функции при всех значениях аргумента, — регрессии, харак- 
теризующие рассеивание реализаций случайной функции на 
плоскости ХОУ (см. рис. 4.1.2). 

Свойство связности для случайной функции есть свойство 
более быстрой (или медленной) изменчивости ее значений по мере 
изменения аргумента (рис. 4.4.1). Степень (сила) связи между 
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любыми двумя значениями случайной функции характеризуется 
автокорреляционной функцией. 

Автокорреляционная (корреляционная, ковариационная) функ- 
ция К [У (2,), У (1;)| случайной функции У (X) есть неслучайная 
функция двух значений Tı, L; того же аргумента, которая для 
каждой пары условных распределений «у по 2» численно равна 
ковариации 


К [У (2), У (2/1 = С0У [У;- У]. (4.4.6a) 


Распространено другое обозначение корреляционной функции. 
Пусть £ — некоторое произвольное значение аргумента, принятое 
за начало отсчета. Выберем новое значение аргумента x -+ T, где 


ах 


называется «сдвигом» аргумента. Тогда корреляционная функция 
есть регрессия ковариаций, определенных для всех т: 


Kyr (1)=K [Y (z), У (2-1), =COV [Y (2), У (z +7), 


0 0 i 
где Y (x) и Y (x + т) — центрированные значения случайной 
функции в условных распределениях у/х и у/т + т. 

Важное прикладное значение имеют свойства корреляционной 
функции: 

1) она симметрична относительно ординаты; 

2) она равна дисперсии случайной функции при т = 0 (ана- 
логично тому, как СОУ[ХХ] = D(X 

3) она убывает до нуля при увеличении т: 

— монотонно (рис. 4.4.2, а), если случайная функция не 
содержит периодических неслучайных компонент; 

— колеблясь вокруг оси абсцисс (рис. 4.4.2, 6), если такая пери- 
одическая компонента имеется; при этом частота колебаний 
Kyy (T) соответствует основной частоте колебаний периодической 
компоненты, чем и пользуются на практике для к 
анализа случайных функций; * 

4) она убывает, монотонно или колеблясь (рис. 4.4.2, a. до 
некоторого постоянного значения C”, где с есть стандартная ошибка 
центрирования случайной функции и вычисления дисперсий 
и ковариаций. 

Величина т, при которой корреляционная функция достигает 
оси абсцисс или асимптоты с? (монотонно или колеблясь), назы- 
вается интервалом корреляции. Он показывает, для какого 
изменения аргумента значения случайной функции взаимозави- 
симы. Если интервал корреляции т a 0, то значения реализации 
случайной функции образуют последовательность, аналогичную. 


* Г. А. Сергеев, Л. П. Навлова, А. Ф. Романенко. 


Статистические методы исследования электроэнцефалограммы человека, 
«Наука», 1968. 
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цепи Бернулли. Если интервал корреляции т = 1.1 — G = 1, 
` то значения каждой реализации случайной функции образуют 
простую цепь Маркова. | 

Случайная функция, каждое значение которой выражено в еди- 
ницах стандартного отклонения при соответствующем значении 
аргумента, называется нормированной. Центрированная и норми- 
рованная случайная функция задается своими основными откло- 
нениями. | 

Корреляционная функция нормированной случайной функции 
называется нормированной корреляционной (автокорреляционной) 
функцией. Она может быть получена двумя путями: либо как 


Kyy(T) 


Рис. 4.4.2. Автокор- 
реляционная функ- 
ция случайной функ- 
ции в зависимости от 
сдвига т. 
Пояснения в тексте. 


0 =. 0 
К[ Ук(Х)-Ух (X + 5%], где Ум (X) — нормированные и центри- 
рованные значения случайной функции, либо нормированием 
значений корреляционной функции при всех значениях сдвига т: 


Kyy (т) 
бу (Х) су (X +7) ` 


Можно видеть, что нормированная корреляционная функция 
есть регрессия по т парных коэффициентов линейной корреляции, 
вычисляемых для всех рассматриваемых 0 < т = Tmax: Очевидно, 
_что максимум Вуу (т = 0) = 1, как и для г;,. Остальные рассмот- 
ренные свойства корреляционной функции сохраняются. 
Свойство связности для случайной функции двух и более 
аргументов или` для системы «одномерных» и «многомерных» 
случайных функций не исчерпывается автокорреляцией и допол- 
няется понятием взаимной корреляции. Соответственно здесь 
рассматриваются взаимнокорреляционные функции и нормирован- 
ные взаимнокорреляционные функции. 
Взаимнокорреляционная (кросскорреляционная) функция слу- 
чайной функции двух аргументов У (X, Z) или (что то же самое) 
двух «одномерных» случайных функций У (X) и U (Z), рассматри- 
ваемых совместно, есть неслучайная функция всех пар значений 
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Вуу (т) = (4.4.7) 


z, Z двух аргументов, образованная ковариациями соответству- 
ющих условных распределений СОУуу (X, Z) или СОУуц (X, Z). 
Свойства взаимнокорреляционной функции подобны свойствам 
корреляционной: | 
1) она симметрична; 
2) она максимально равна произведению соответствующих 
стандартных отклонений: | 


[Kyy (X, Z)lmax = бу (X) + бу (Z), 
[Kyu (X, Z)lmax = бу (X) -0y (2); 


3) Если Kyy (X, Z) = 0, то аргументы X и Z некоррели- 
рованы, если же Kyy (X, 2) = 0, то случайные функции Y (X) 
и U (Z) некоррелированы. 

4) Нормированные взаимнокорреляционные функции убывают 
от единицы до нуля, монотонно или колеблясь. 

Учитывая понятия авто- и взаимнокорреляционных функций, 
можно выделить следующие практически важные свойства диспер- 
сии и корреляционной функции для суммы случайных функций 
одинаковых аргументов. 

Дисперсия суммы случайных функций равна сумме максиму- 
мов автокорреляционных и взаимнокорреляционных функций 
слагаемых: - 


(4.4.8) 


fat, max 


Reo Ar. 


Š Dir, (X)] 
+H ÈK Y, n) ; (4.4.9) 
Ri Е Е 


В частности, для некоррелированных слагаемых 
n 


R 
Г=1 тах 
‚ и дисперсия суммы есть только сумма дисперсий слагаемых. 
Заметим, что рассмотренные выше формулы дисперсии суммы слу- 
чайных величин (4.2.4) и (4.2.5) — это частные случаи (4.4.9.).. 
Аналогично можем записать и более общее равенство для 
корреляционной функции суммы случайных функций: 


В R 
K |; X a) =2 KIY, (X), Y, (X++ 
+5 K [У; (X). Y) (4.4.10) ; 


17 T. В. Суходольский | = 257 


где рассматриваются, уже не только максимальные, но любые 
значения сумм автокорреляционных и взаимнокорреляционных 
_ функций. В частном случае взаимной некоррелированности сла- 
_ гаемых функций последнее слагаемое обращается в нуль, поэтому 
корреляционная функция суммы некоррелированных слагаемых 
равна сумме автокорреляционных функций этих слагаемых. 


4.4.2. Некоторые классы случайных функций, важные для 
психологии 


Все разнообразие случайных Pynta классифицируется по 
нескольким основаниям. 

По числу аргументов мы уже выделяли случайные функции | 
одного аргумента («одномерные») и двух и более аргументов 
(«многомерные»). В последнем случае рассмотрению подлежат 
метасистемы. Очевидно, ансамбли физиологических и психологи- 
ческих функций следует рассматривать именно таким образом. 

По физической природе аргументов принято выделять случай- 
ные процессы как случайные функции от времени. Для психологов 
случайные процессы представляют особый интерес, так как все 
психические процессы, безусловно, являются случайными и должны 
исследоваться посредством аппарата теории случайных процессов. 

Классу случайных процессов противостоит класс случайных 
функций от других аргументов любой природы. Здесь представляет 
интерес выделение случайных функций от многих аргументов, 
природа которых различна. В психологических и ‘смежных при- 
ложениях такими аргументами служат комплексы воздействий 
внешней и внутренней среды организма, включая не только слу- 
чайные, но и целенаправленные воздействия: педагогические, 
социальные, медицинские. 

Разумеется, что основной понятийный и вычислительный 
аппарат теории случайных функций не зависит от физической 
природы аргументов. По тому, являются ли аргумент и функция 
(как способ связи) случайными, можно выделить случайные функ- 
ции неслучайных аргументов и неслучайные функции случайных 
аргументов. 

Типичными примерами случайных функций неслучайных аргу- 
ментов являются результаты строго дозированных воздействий 
лекарств, физических сенсорных стимулов, или обучающих про- 
грамм на людей. Результаты этих воздействий — соматические, 
_ физиологические и психические состояния, а также социальное 
положение из-за флюктуаций внутренней среды организма явля- 
ются случайными функциями. 

Неслучайные функции случайных аргументов мы рассматри- 
вали выше. Но следует добавить сюда любые инструментальные 
действия человека. ` 

Наконец, в общем виде случайные функции случайных аргу- 
ментов, очевидно, охватывают большинство психических про- 
цессов и функций. 
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По степени изменчивости количественных xapakmepucmuk 
случайной функции в зависимости от изменений аргумента выде- 
JAHT стационарные, квазистационарные и а pia слу- 
чайные функции. 

Стационарные случайные функции наиболее изучены. Слу- 
чайная функция стационарна в узком смысле, если для всех зна- 
чений аргумента ее условный закон распределения неизменен. 
Такая функция полностью определяется одномерным распределе- 
нием. Случайная функция стационарна в широком смысле, если 
ее математическое ожидание и дисперсия суть константы (т.е 
не зависят от аргумента), а корреляционная функция зависит 
только OT сдвига т и не зависит от начала. отсчета. 

Нестационарной называют случайную функцию, для которой 
условия стационарности в нироком смысле не выполняются. 
Если при этом изменения М [У (X)| и D (У (X)| в некотором 
смысле не велики, а К [У (X), У (X + 1)! слабо зависит от начала 
отсчета сдвига т, то случайную функцию называют ивази (почти) 
стационарной. Отметим, ‘что разработка классификации неста- 
ционарных случайных функций лишь начинается *. 

Для психологии чрезвычайно важно установить принадлеж- 
ность изучаемых психических процессов, состояний и свойств 
к стационарному или нестационарному классу функций. Дело 
в том, что подавляющее большинство статистических мер и методов 
разработано для условий стационарности, тогда как общеизвестны 
возрастная, сезонная, недельная, суточная и т. п. периодичность 
случайных изменений психики, а также ее изменчивость от целе- 
направленных обучающих и воспитательных воздействий. Можно 
сказать, ‚ что большинство явлений психики не удовлетворяет 
условиям стационарности. И тогда задача исследования может 
состоять в установлении областей значений аргументов, для кото- 
рых можно говорить о квазистационарности. 

По возможности заменить изучение множества реализаций 
случайной функции изучением ее одной, но достаточно длинной 
реализации выделяют эргодические о ве случайные 
функции. 

Эргодическими называются случайные функции, для которых 
матёматическое ожидание и корреляционная функция, определен- 
ные по множеству реализаций, равны полученным по одной pean- 
зации. Для неэргодических они не равны. Очевидно, что все эрго-_ 
дические функции стационарны хотя бы в широком смысле. _ 

. Для психологических исследований понятие эргодичности 
весьма важно. Ведь тщательное изучение одного человека эконо- 
мически выгоднее, да и редкие психические явления невозможно 
изучать в большом количестве. С другой стороны, только для 
эргодических процессов и функций результаты, полученные на 


_<*А. Ф. Романенко, Г. С. Сергеев. Вопросы прикладного 
анализа случайных процессов. «Советское радио», М., 1968. 
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множестве людей, в короткий период времени могут быть перене- 
сены на отдельных людей и, наоборот, результаты лонгитудиналь- 
ных исследований отдельных индивидов (или малых групп) могут 
быть справедливы для больших групи. Следовательно, необходимо 
исследовать психические явления на эргодичность, т.е. опреде- 
лять их количественные характеристики и по множеству, и по 
отдельным реализациям. 


4.4.3. Определение характеристик случайной 
функции из эксперимента 


При экспериментальном изучении случайной функции можно 
выделить две ситуации: наблюдений достаточно для группировки. 
данных и определения оценочной функции распределения и на- 
блюдений мало для этого; тогда определяются оценки математи- 
ческого ожидания, дисперсии и корреляционной функции. 

Чтобы определить закон распределения случайной функции 
от одного аргумента, поступают так же, как для двух случайных 
величин (глава 3). Не повторяя рассмотренного, для примера 
покажем лишь результат. В табл. 4.4.1 представлены условные 


Таблица 4.4.1 


Условные распределения частостей ошибки слежения в функции 
от времени 
y — средние значения интервалов квантования ошибки слежения, мм; 
t — средние значения интервалов квантования времеви, сек; 


М[У(В] — оценки математического ожидания; 
о [У (1)] — оценки стандартного отклонения ошибки слежения. 


4,75 


Art 0,25 0,75 1,25 1,75 2,25 2,15 3,25 3,75 4,25 
писки оконечное чт уточнит жчашя ок чести тетя шит он 
A 
0,001 | 0,001 


0,0041 — 
0,009 | 0,002 

| 0,028 | 0,006 
0,035 | 0,010 
0,115 |-0,020 | 0,001 0,001 | 0,001 0,004 
0,097 | 0,036 | 0,005 | 0,002 | 0,003 | 0,004 | 0,008 | 0,001 0,003 
0,243 | 0,081 | 0,045 | 0,025 | 0,019 | 0,015 | 0,014 | 0,0214 | 0,013 | 0,016 
0,260 | 0,162 | 0,098 | 0,110 | 0,102 | 0,092 | 0,058 | 0,061 | 0,067 | 0,069 
0,183 | 0,325 | 0,329 | 0,302 | 0,334 | 0,304 | 0,353 | 0,390 | 0,412 | 0,403 
0,026 | 0,140 | 0,230 | 0,272 | 0,285 | 0,283 | 0,283 | 0,302 | 0,289 | 0,337 
0,002 | 0,157 | 0,221 | 0,227 | 0,194 | 0.236 | 0,212 | 0,180 | 0,166 | 0,128 


~ 


` | 
no Ra aa E a A A AN Aaa D, 
> © > 00 В 5 © > 60 > 55 © 


- 


~ 


8 0044 | 0'060 | 0.054 | 0.058 | 0.052 | 0061| 0.034 | 0.040 |0035 
9 0.009 | 0,006 | 0.007 | 0'008| 0.012 | 0.010 | 0.010 | 0.012 | 0.006 
8 0003| 0.002 | 0'004 0.002 — 100014 
0 0.002 | 0.002 | 0,001 | 0’001 
4 0'001 

M [Y (¢)] | —1,16| —0,39 —0,12| —0,10| —0,11| —0,07| —0,07| —0,08 —0,12| —0.15 


о[У (01 | 0,68 | 074 | 053 | 08 | 07 | 048 | от | 04 | 0,43 | 0,43 


260 


законы распределения частостей. ошибки слежения за движущейся 
целью в функции от времени слежения, в условиях, когда испы-. 
туемый запаздывает с реакцией *. Оценки значений математи- 
ческого ожидания и стандартного отклонения ошибки слежения 
в функции от времени приведены в нижних строках таблицы. 
Видно, что они изменяются, следовательно, слежение — неста- 
ционарный процесс. 

Рассмотрим процедуру вычисления оценок ‚для количествен- 
ных характеристик случайной функции. 

Пример 4.4.1. Пусть человек непрерывно прицеливается в дви- 
жущуюся цель в течение времени Г. Отклонения прицельного 
приспособления от цели в каждый момент времени {образуют 
ошибку слежения, величина которой (у) случайна. Таким обра- 
зом, ошибку слежения можно рассматривать как случайную 
функцию времени, которую обозначим У (T). Значения двадцати 
трех реализаций этой случайной функции для одиннадцати зна- 
чений времени приведены в таблице 4.4.2. ** | 
Таблица 4.4.2 _ 


Реализации ошибки слежения к примеру 4.4.1 


№, t 0,00 10,25 Е. Ч Ея © PE 2:25 2,75 3,25 112 ЕЕ: 
= 

4 |-0,3|—48|—0,4|—0,6|—0,8 | 0,2 |—0,6 | —0;2 1—0 | —0,5| —0,2 
2 |-40|—0,5| 04| —44|-—0,4 | —0,6 | —0,4 | —4,5 |--07 | —0,5 | —0,8 
3 |-0,3|—0,5 | -4-4.21--4.6 | —0,6 | —4,4 |—0,2| 0 Оо 
4 |-0,8|—2.01—0,4 |544 |4 |--502 0 |003 | 0,3-0,6] =0/7 
5 |+ 06| —2,2| —4.2| 40,8 | 50,3 | —0,6 | —0,4 | --0,2 |—0,9 | —05| 0 
6 |-04|—13|—0,8| —0,3 —0,4 | +0,5 1 +0,6 |—0,6 | —0,8 | —0,6 
7. |-20,5 | —2.2|— 0,31 —0,2 | —0.5=04 | —0,3 |—0,4 |-Е0,4 |--—0,8| —0,2 
8 |-0,5| —3,0| —4.8| —0,4 | 0,2 | 0,8 | —0,8 | —0,5 |—0,9 | —0,9 | —0,2 
9 |-06|—2,0 | —4,6 | —0,9 | —4,0 | —0,2 | —0,8 | —0,8 | —0,4 | —0,3 | —0,6 
10 |--0,5|—2,2| —0,6 | 0/4 | —0,8 | —0,4 |—0,3 | —0,9 | —4,4 | —0,7 | 50,4 
14 | -Р0л|—1,01 44.2 | 0,4 | —0,5 | —0,5 |-=0,9 —0,4 | —0,8 | —0,3 
12 |-505|—24|—0,6 | 4-0; | 0,4 | -+40 |-50,5 | 0 |-0,5 |+-0,5 | 0,6 
13 |-0,9|—43 | 43| -06140905 | —0,;7 | —0,5 | —0,4.| —0,4 |-—0,5 
14 |--0,3|—2,3 | —0,3 | +5 0,6 | -Н0,4 | —0,2 | —0,4 | —04 | 0 01—10 
15 (F01 -82| —43| -051-061 =f 3-021402 |+04 404|- 04 
16 |-0,6|—4,7|—0,7 | —0,8 | —0,4 -—0,6 | —0,9 |—0,5 —0,3 | —0,3 
47 |--06|—19|—16|—04 | +04 |412 |--0,8 |+0,9 | —=0,6 | — 4,4 | +1,0 
18 +14,0] —1,7|—14,1 | —0,21 +1,61 +0,8 | +0,2 |0 |—0,5 |—08|—0,3 
19-08109 —12—06 |024 | 0,2 |087 
20 |-06|—0,3 | 41,0 | 0,2 | —4,4 | +0,5 [+1,4 1-40 | —0,5 |—0,8| —4,0 
21 |-0,4|—0,2 | +0,9 | +0,9 | +0,8 | +0,6 | +0,6 | —0,1 | —0,4 | +0,3 | +0,2 
22 | -+0,5 1—0,6 | 40,2 | +0,3 |+0,6 | +0,4 | +0,2] —02 | —0,4 —0,4 
23 | +0,5] —1,6 | —0,9 | +0,7 | +1,3 | +0,5 | —0,3 | +0;4 -+0,1 | —0,6 

Miro +s |15 —0,5 [+02 008 —0,4 | —0,4 | —0,4 | —0,3 | —0,4 | —0,3 


* Г. В. Суходольский. О характеристиках человека при сле- 
жении. Автореферат канд. дисс. Изд. ЛГУ, 1968. _ 
+* Г. В. Суходольский. О характеристиках человека при сле- 
жении. Ук. соч. 
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`Вычислив все условные средние арифметические М[У (1], — 
они записаны в последней строке табл. 4.4.2 — случайную функ- 
цию центрируют по уравнению (4.4.3.). Центрированные значения 
_ ошибки слежения представлены в табл. 4.4.3. 
\ | | - Таблица 4.4.3 
Центрированные реализации ошибки слежения 
M [Y(t)] — ошибка центрирования; в [Y(t)] — условные стандартные отклонения. 


20:4 --0.00-10,.25 10:75 1:25 а 2:59:35 3,75 4,25 4,75 
> 1031-03104 061-08-01: 05104 |-041—041--604 
2 |404 |--4.0 |--04 | 44—04 |—0,5 | — 0,3. | —4.4 |440 | 0,1! —0,5 
3 |-—0,3]|--4.0 |--417|-4-4,6 | —0,6 | 1.0 | —0,4 |+-0,4 | --0,3 | 40,4 | 50,3 
д -|-60.2 | — 0.50 АО Ол 1-02] 0. [021—048 
5 0 |—07|-—0,71--0.81-50,3 | —0,5-| —0;3:| --0,3 10,6 04| EE 
6 |021 Nk ESTEE 9,3 1-50.61--09 1 —0.3 [04-03 
тбл 02021-09705 0 T a 030 ОаЬ-ь0а 
8 |—0,4| —4,5|—4,3| —0,.4| 450,2 | -0,9 | —0,7 | —0,4 | —0,6 | —0,5| +04 
9 0-605-144-0091 0-07 01-0403 
10 |—0.1|-=07]-—=0,41-50.4|—0.8|1—0,3.| 0.214 0,8.| 0.81 0,3 | -507 
144 |--0,4 | --0,5 RE | 0,4 | —0,5 | —0,4 | —0,8 |504 | —04 | —0,4| 0 
12 |041 |—0,6 |—0,4 | 40,7 | 0,4 | 54.4 | --0,6 1-04 |-20,8 | 40,9 | 50,9 
13° |--0,3 | 50,2 |--0,8 |—0,6 | 450,9 | —0,4: | —0,6 | —0,4 |--0,2 E, 
14 |—0,3|—0,8 |--0,2 | t00] 40t | —0,4 | —03| 0 E0 0AF 0T 
15 |-0,4,| 40,3 |—0,8 | —0,5 | —0,6 | —4,2 | —0,4 |403 |--0,7 | 40,8 | —0,4 
16 01-02 0.2[-0.8 |041 05 |058 |—04 [5031104 |-.0 
17 0 |=—0,4|—14|—0,4 1-04-43 -+-0,9. Ap a03 0T 1,3 
148 Hozi 02 lobt —0,2 | 4,6 AA | 0 a | —0,4| 0 
193 aE 041-03 091-32-05 |--031[--01| 3-05 |-431-43 
20 0 |--1.2 |445 | 50,2 | —4,4 | --0,6 | 44,5 [444 | —0,2 | —0,4| —0/7 
24 |—0,2| 4.3 |414 | 0,9 | 0,8 | 40,7 | 0,7 —0,1 |--0,7| --0,5 
22 |—0,4|--0,9|4-0,7 | 0,3-0,6 | 0,5 |-60,3 | —0,4.| —0,4 |-2 04| —0,4 
23 |—0,4| —044 |--0,4 | 50/7 [--4,3[-50,6 | -—=0,2 |--0,5 | 0.3 |--0,5| —0,3 

М[У()1-—0,01|- 0,02] 0 |+0,02|—0,03|+0,04 |—0,05 |—0,03 |+0,01 |—0,04|—0,03 

olY(t)] | 0,20| 0,74| 0,88| 0,76| 082| 0,68| 0,60| 0,56| 0,46] 0,53| 0,56 


Чтобы устранить появление грубых ошибок центрирования, 
обязательно вычисляют средние арифметические из центрирован- 


ных значений случайной функции. Эти средние М[У (1] пред- 
ставляют собой ошибку центрирования. Средний квадрат центри- 
рованных значений случайной функции есть ее условная диспер- 
сия. Извлекая корни квадратные, получим оценки условных 
стандартных отклонений о [У (1]. (табл. 4.4.3.). 

Для вычисления корреляционной функции необходимо опре- 
делить ковариации всех сочетаний по два из одиннадцати столб- 
HOB табл. 4.4.3. Результаты образуют ковариационную матрицу 
(табл. 4.4.4), в которой по главной диагонали расположены услов- 
ные дисперсии. Нормируя элементы ковариационной матрицы 
произведениями соответствующих пар стандартных отклонений 
из табл. 4.4.3, получим матрицу коэффициентов корреляции. 
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Таблица 4.4.4 
Ковариационная матрица оптибки слежения а 


n 0,00 0,25 0,75 1,25 1,75 2,25 
0,00 0,040 0,016 — 0,029 —0,066 _ 0,039. | —0,001 
0,25 0,542 0,272 —0,015 —0,045 —0,102 
0,75 0,783 0,305 —0,149 —0,074 
1,25 | 0,577 0,113 0,074 
1,75 0,673 0,262 
2,25 0,453 
2,75 
3,25 
3,75 р 
4,25 
4,79 

Продолжение табл. 4.4.4 

^Щ | 2,75 | 3,25 | 3,75 | 4,25 4.175 
0,00 — 0,010 — 0,032 0,008 — 0,048 —0,044 
0,25 0,169 0,059 0,089 0,079 — 0,083 
0,75 0,142 0,069 0,053 0,083 —0,040 
1,25 0,128 0,149 —0,030 0,160 0,119 
1,75 0,052 0,035 0,025 0,129 _ 0,094 
2,25 0,210 0,113 —0,036 — 0,020 0,109 
2,15 _ 0356 0,213 —0,022 0,014 0,067 
3:29 0,313 —0,052 0,026 0,041 _ 
3,15 0,240 0,142 —0,015 
4,25 0:276- A 0,075 
4,19 0,313 


(табл. 4.4.5). Заметим, что по каждой диагонали этой матрицы, 
параллельной главной диагонали, расположены значения коэф- 
фициентов корреляции, относящиеся к одному и тому же значе- 
нию сдвига T, но соответствующие разным началам отсчета. 
По определению стационарности в широком смысле, корре- 
ляционная функция не должна зависеть от начала отсчета. Это. 
значит, что все коэффициенты корреляции, лежащие на одной 
диагонали, должны быть равны по величине. Можно видеть, что 
в табл. 4.4.0 величины и даже знаки коэффициентов одной и той 
же диагонали различны для всех диагоналей. Это свидетельствует 
о нестационарности ошибки слежения. Аналогично М [У (1] 
и о [У (10| в данном случае тоже нестационарны. 
Корреляционная функция нестационарной случайной функции 
должна быть задана совокупностью своих значений для всех 
начал отсчета т. Но для простоты аппроксимируем ее в рас- 
сматриваемом примере стационарной корреляционной функцией. 
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a Таблица 4.4.5 
Матрица коэффициентов корреляции = 
Вуу (т) значения оценок нормированной корреляционной функции ошибок слежевия; 

t — начало отсчета; т — сдвиг аргумента. 


$, т [0,00 [0,25] 0,75 | 1,25 | 1,75 | 2,25 | 2,75 | 3,25 | 3,75 | 4,25 | 4,75 
0,00 | 1,00 10,16 —0,46 |—0,43| 0,24 |—0,01 |—0,08 |—0,30 A — 0,39 
0,25 1,001 0.42 |-—0,03 |—0,07 |—0,20 | 0,381 0,141 0,27: 0,20 | —0,20 
0,75 _| 4,00] 0,46|—0,21 В. 12| 0,271 0,14| 0,43| 0,18|—0.08 
4:25 1,001 0,148] 0,14| 0,28| 0,35|—0,09| 0,40 0,28 
АЕ 1,00 0 47| 0,44] 0,081 0,071! 0,30 0,20 
225 5 0,54 | 0,30 |—0,12 |—0,06 0,29 
2 T9 1,001 0,63|—0,08| 0,04 0,20 
3,25 1,00 |—0,20| 0,09 0,13 
2-2 1,00| 0,58 | —006 
4,25 1,00 9:25. 
4,75 | _ 1,00 

Ву (т) 00 | 035] 0,01 |003] < 0,12 | 0,17 0,14 0,07 | 0,07 | —0,32 —0,39 


Рис. 4.4.3. Hopma- 
рованная корреля- 
ционная функция 
стационарного 
процесса, аппрок-. 
симирующего 
ошибку слежения. 
По оси ординат Вуу 


(т), по оси абециее — 
сдвиг т, сек. 


Стационарную аппроксимацию нормированной корреляционной 
функции получим, усредняя коэффициенты по диагоналям и сопо- 
ставляя полученные средние значения координатам т: 


4 T ЕЕ _ (t, t-+T) 
Ryy See У бу (1) бу (Е-- т) ’ 


где А — количество усредняемых коэффициентов убывает от один- 
надцати (при т, = 0 сек) до одного (при Ti, = 4,75 сек). Так 
как при усреднении допускается некоторая оптибка, величина 
которой тем больше, чем` меньше А, точность’ оценки значений 
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Вуу (т) уменьшается с ростом т. В частности, значения Вуу (т} 
при всех T > 1,75 сек сомнительны. Однако для демонстрации 
проанализируем полученную нормированную = 
ную функцию, показанную на рис. 4.4.3. 


Можно видеть, что функция Rey (т) затухает, колеблясь, 
вокруг горизонтали, параллельной оси т. Это обстоятельство 
всегда свидетельствует о наличии ошибок центрирования и вы- 
числений (они, однако, не влияют на свойства полученной 


кривой). Периоды колебаний функции Вуу (1), судя по рис. 4.4.3, 
приблизительно равны 1 сек. Это свидетельствует о наличии пери- 
одической компоненты в ошибке слежения, с основной частотой, 
равной приблизительно Í колебанию.в секунду. Наконец, можно 
видеть, что прит a 0,5 сек функция пересекает асимптоту; значит, 
интервал корреляции составляет около 0,5 сек. 


- Глава 5 


ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 


_$ 5.1. ЗАДАЧИ СТАТИСТИЧЕСКОЙ ПРОВЕРКИ ГИПОТЕЗ 


9.1.1. Генеральная совокупность и выборка 


Из-за массовости случайных явлений, выступающих объектами 
научных исследований, приходится отличать тб, что должно 
быть изучено, от того, что реально может быть изучено и изучается. 
Например, если должна быть изучена степень возможности появ- 
ления некоторого случайного события, то необходимо рассмотреть 
бесконечно большое число испытаний, в части которых могло бы 
появиться это событие, и определить его вероятность. Это, однако, 
невозможно практически; приходится ограничиться частостью 
_как оценкой для вероятности, определяемой при некотором конеч- 
ном числе испытаний. В этой связи’ в математической статистике 
выделяются два фундаментальных понятия: (генеральная) сово- 
купность как то, что подлежит изучению, и выборка — как то, что 
реально изучается. Очевидно, что выборка должна адекватно 
отображать генеральную совокупность, иначе результаты не 
совпадут с целями исследования. Тому, что это означает, в сущ- 
ности, и посвящена математическая статистика как наука. 

Совокупность и выборку можно рассматривать содержательно 
и формально по-разному, причем формальное рассмотрение важно 
с точки зрения применяемого описательного аппарата теории 
вероятностей, а содержательное — еще и с точки зрения органи- 
зации исследования. Поскольку понятие совокупности является 
исходным, начнем с него. 

Совокупностью будем называть практически счетное * множе- 
ство некоторых объектов (элементов), интересующих исследова- 
теля. Понятно, что, определяя эти объекты содержательно (психи- 
ческие свойства, состояния, процессы и т. д.) или формально 
(события, величины, функции и т. д.), мы так же определяем 
и всю совокупность. Свойством совокупности будем называть 
реальное или воображаемое качество, присущее некоторым или 
всем ее элементам. Параметром совокупности будем называть 
свойство, которое можно квантифицировать в виде константы 


* Часто для удобства в теории рассматриваются несчетные множества, 
например, бесконечно большое число испытаний. . 
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или переменной величины. * Свойство или параметр могут быть 

случайными и не случайными. Соответственно, совокупности 

рассматриваются как стохастические и детерминированные. 

Простой (одномерной) совокупностью назовем ту, которая 
характеризуется: 

— отдельным свойством, например, все негры США; 

— отдельным параметром в виде константы или переменной, напри- 
мер, все ленинградцы среднего роста, или рост ленинградцев; 

— системой непересекающихся (несовместных) свойств, например, 
все студенты и преподаватели ЛГУ. 

Сложной (многомерной) совокупностью назовем ту, и: 
характеризуется: 

— системой хотя бы частично пересекающихся свойств, например, 
студенты физического и психологического факультетов ЛГУ, 
мужского и женского пола, окончившие школу с медалями; 

— системой параметров, независимых (частично зависимых) и за- 
висимых в совокупности; примером может служить система 
параметров, изучаемая в комплексном исследовании личности**. 
Гомогенной (однородной) назовем совокупность, все характе- 

ристики которой присущи каждому ее элементу (т.е. распреде- 

лены по всей совокупности одинаковым образом). 

Гетерогенной (неоднородной) назовем совокупность, характе- 
ристики которой сосредоточены в отдельных подмножествах 
элементов, так что гетерогенную совокупность можно рассмат- 
ривать как объединение гомогенных подсовокупностей. | 

Все стохастические простые и сложные совокупности могут 
быть гомогенными; гетерогенными — почти все, за. исключением 
простой, характеризуемой отдельным свойством или параметром 
в виде константы. 

Неполная классификация совокупностей в пояснение изложен- 
ной систематики приведена на рис. 5.1.1. Можно полагать, что 
для психологической теории и практики наибольший интерес 
представляют стохастические многомерные гетерогенные совокуп- 
ности, характеризуемые системой a даже — системами) mapa- 
метров и свойств. 

Параметром, важнейшим с точки зрения возможностей иссле- 
дования, является объем совокупности — количество образующих 
ее элементов. Величина объема часто зависит от того, как опре- 
делена сама совокупность. Мы уже встречались с этим вопросом 
в главе 1, рассматривая число исходов опыта и полную группу 
событий. Действительно, если, например, нас интересует эмоци- 
ональное состояние конкретного студента 1-го курса в период 
сдачи конкретного зачета в зимнюю сессию, то генеральная 


* Свойство является «вырожденным» параметром, так как оно кванти- 
фицируется в двоичной системе счисления. 
*Б. Г. Ананьев. Человек как предмет познания. Л., 1969; 
B.T. Ананьеюь, А. С. Пашков. Комплексное исследование социаль- 
ных проблем. В сб.: Человек и общество, вып. VIII. JI., 1974. 
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совокупность исчерпывается дискретным числом оценок ƏMONMO- 
нального состояния данного студента, полученных в течение полу- 
часа. Иной объем будет иметь совокупность эмоциональных 


Совокупности 
| Детерминированные Стохастические | 
Гомогенные | Гетерогенные 
Простые Сложные 
(одномерные) (многомерные) 
Характери- |. Характери- Характери- Характе- 
` зуемые зуемые _ зуемые _ризуемые 
свойством системои системой хотя системои 
или не пересе- бы частично параметров 
параметром кающихся пересека- 
свойств и/или ющихся 
параметров свойств и/или 
параметров 


| 


С независимыми 
в совокупности 
параметрами 


| 


С частично 
зависимыми 
в совокупности 


параметрами 


| 


С зависимыми 


в совокупности 


параметрами 


Рис. 5.1.1. Классификация генеральных совокупностей. 


Для гомогенных совокупностей в математической статистике рассматриваются почти все 


те же виды, что приведены для гетерогенных совокупностей. 


состояний всех студентов 1-го курса, еще больший — совокупность 
`для студентов всех 1-х курсов данного вуза; еще больший, — при 
условии нескольких зачетов и экзаменов ит. д. Если совокупность 
из одного студента можно изучить с рассматриваемой точки зрения 
досконально, то совокупность из студентов всех 1-х курсов, не 
`ограничивая годы изучения, исследовать уже не представляется 
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возможным. Понятно, что общая и социальная психология по 
сравнению с другими психологическими отраслями преимуще- 
ственно занимаются совокупностями очень большого, хотя и конеч- 
ного объема, исследовать тары иначе, чем выборочным путем 
нельзя. 

Выборкой будем называть некоторую часть генеральной сово- 
купности. Принято классифицировать выборки по репрезентатив- 
ности, по объему, по способу отбора и по схеме испытаний. Репре- 
зентативной (представительной) называется выборка, адекватно - 
отображающая генеральную совокупность в качественном и коли- 
чественном отношениях. Что это конкретно означает, можно будет 
объяснить лишь в дальнейшем изложении. Однако заметим, что 
репрезентативность выборки непосредственно зависит от ее объема. 
Априори ясно: чем ближе объем выборки к объему совокупности, 
тем репрезентативнее выборка. Способы отбора и схемы испытаний, 
в сущности, лишь обусловливают возможность получить репрезен- 
тативную выборку при ограниченном объеме. 

По способу отбора выделяют: случайную и неслучайную (меха- 
ническую, типическую, серийную и комбинированную) выборки. 

Выборка называется случайной, если элементы генеральной 
совокупности отбираются случайным образом. Под этим обычно 
понимают равные шансы для каждого элемента. быть выбранным. 
Альтернативой случайной выборки является выборка, отбор 
в которую тенденциозен. Так как большинство методов математи- 
ческой статистики основывается на понятии случайной выборки, 
остановимся на нем подробнее. 

Рассматривая. нормальное распределение (стр. 133), мы отме- 
чали, что случайная величина имеет нормальное распределение 
при условии, что на нее действует большое число случайных фак- 
торов, равных по силе воздействия. Мы также указывали, что 
при п >20 и p ~ q биномиальное распределение практически 
не ‘отличается от нормального (стр. 161). Тот факт, что комнпо- 
зиция нормально распределенных аргументов имеет нормальное 
распределение (стр. 234), может быть обобщен и на композиции 
распределений аргументов, отличных от нормального, при усло- 
вии большого числа равнодействующих случайных аргументов. 
Указанные обстоятельства`и составляют существо так называе- 
мого закона больших чисел, на котором основываются все пред- 
ставления 0б ошибках оценивания свойств и параметров гене- 
ральной совокупности по выборке. В этой связи, очевидно, выборка 
должна быть случайной уже потому, что иначе нельзя правильно 
использовать разработанные в теории математической статистики 
` приемы и методы оценивания. С другой стороны, выборка должна 
быть случайной для того, чтобы преднамеренно или нечаянно не 
исказить «истинных» характеристик генеральной совокупности 
тенденциозным отбором элементов в выборку. 

Считается, что любые неравные шансы для элементов попасть 
в выборку приводят к тенденциозному, неслучайному отбору. 
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р немало. методов ‚организации случайного отбора. 
Не разбирая их подробно, * укажем на основной — это произ- 
вольная нумерация элементов из генеральной совокупности, 
а затем выбор по таблицам равновероятных случайных чисел. 

Заметим, что в психологических исследованиях редко забо- 
тятся о случайном отборе испытуемых, хотя внешние стимульные 
воздействия организуются в случайном порядке. Понятно, что 
благодаря этому полученные экспериментальные оценки изучае- 
мых явлений менее адекватны популяции homo sapiens, чем при 
случайной выборке испытуемых. Поясним сказанное следующим 
образом. Пусть изучение некоторой психической переменной осу- 
ществляется на группе испытуемых-студентов. Даже если эта 
группа представляет собой случайную выборку из совокупности 
студентов данного вуза, она является не случайной, а тенден- 
циозной, например, относительно всех жителей данного города, 
имеющих тот же возраст, уже потому, что на психические перемен- 
ные не может не влиять уровень образования, а студенты — люди 
высокообразованные. Поэтому данные, полученные на студентах, 
строго говоря, справедливы лишь для студентов. Эти очевидные 
вещи приводят к нетривиальному для математической статистики 
выводу: случайная выборка, как она обычно понимается, примени- 
ма безоговорочно лишь для гомогенных совокупностей. Как же изу- 
чать выборочным путем гетерогенные совокупности? 

Очевидна необходимость репрезентативно отобразить в вы- 
борке структурные (качественные и количественные) характе- 
ристики гетерогенной совокупности. Столь же очевидно, что этого 
можно достичь средствами случайного отбора лишь при условии, 
что объем случайной выборки приближается к объему генераль- 
ной совокупности. Поскольку выборка такого объема столь же 
нереальна, как и изучение всей генеральной совокупности, воз- 
никает парадоксальная необходимость использовать неслучайную 
выборку. 

Неслучайный отбор может быть механическим, типическим, 
серийным и комбинированным. Все эти виды, в сущности, соче- 
тают тенденциозный и случайный отбор. 

При механическом, отборе вся совокупность делится на столько 
частей, сколько единиц планируется в объеме выборки, после чего 
случайным образом из каждой части отбирается один элемент, 
включаемый в выборку. При типическом отборе совокупность 
делится на гомогенные части, после чего из каждой части осущест- 
вляется случайная выборка. При серийном отборе генеральную 
совокупность делят на большое число равновеликих серий, после 
чего случайную выборку делают не из единиц, а из серий совокуп- 


* Рассмотрение собственно выборочных методов можно провести лишь 
в контексте методов планирования эксперимента. Но современное планирова- 
ние экспериментов далеко выходит за рамки математической статистики и 
требует особого рассмотрения. 
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ности, причем серии, попавшие в выборку, изучаются сплошь. 
При комбинированном отборе сочетаются на разных этапах уже 
рассмотренные виды отбора. Одной из разновидностей комбини- 
рованного отбора является двухступенчатый отбор, при котором 
на первой ступени осуществляется серийный отбор, а на второй — 
из каждой серии, попавшей в случайную выборку серий, выпол- 
няется случайная выборка элементов. Другая разновидность ком- 
бинированного отбора состоит в следующем. При отсутствии досто- 
верной априорной информации любая совокупность считается 
гомогенной и из нее на первом этапе случайным образом делается 
выборка большого объема, по которой апостериори выявляется 
гетерогенный характер совокупности и определяется многомерное 
распределение вероятностей ее гомогенных частей. На втором 
этапе, уже на основе апостериорной информации о типических 
характеристиках совокупности, осуществляется типический от- 
бор, и в результате нового выборочного исследования уточняются 
сведения о генеральной совокупности. Далее могут следовать 
третий и другие этапы с повторными уточняющими типическими 
выборками. 

По схеме испытаний выборки делятся на независимые (повтор- 
ные, простые) и зависимые (бесповторные, сложные). Суть этого 
разделения в том, чтобы вероятностные характеристики генераль- 
ной совокупности не изменялись под бесцеремонными воздей- 
ствиями исследователя. Простая выборка образуется по схеме 
независимых испытаний (стр. 30), т. е. элементы, вошедшие в вы- 
борку, возвращаются’ обратно в генеральную совокупность, бла- 
годаря чему безусловная вероятность каждому элементу быть 
избранным не меняется в процессе отбора. При бесповторной 
выборке элементы, однажды выбранные, уже не могут выбираться 
снова: они исключаются. Таким путем по ходу отбора объем сово- 
купности уменьшается и состав ее изменяется, так что условные 
вероятности быть выбранными для оставшихся элементов все время 
увеличиваются. В.свою очередь это означает, что элементы вы- 
борки оказываются зависимыми, причем эта фиктивная зависимость 
должна быть учтена, иначе ее можно ошибочно приписать самой 
генеральной совокупности. Понятно, что, чем больше объем исход- 
ной совокупности, тем меньше различия между простой и бес- 
повторной выборками. 

По объему принято выделять малые и большие выборки. 
Малыми считают выборки, объем которых n < 30. Понятие боль- 
шой выборки не определено. Рассматривая массивы данных, 
полученных при изучении двумерной системы (стр. 198), мы выде- 
лили три класса объемов выборок, основываясь на возможности 
сгруппировать данные и оценить распределения величин в системе, 
а также определить значения всех или только некоторых числовых 
характеристик. При таком практически полезном подходе малая 
выборка имеет объем n < 30, средняя 30 < п = 200 и большая _ 
п >> 200. Конечно, это деление весьма условно. Наивно было бы 
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судить о неизвестных свойствах совокупности по выборке малого 
объема. Поэтому малые выборки используются при статистиче- 
ском контроле известных свойств изученных совокупностей. 
Большие выборки, ‘наоборот, используются как раз для установ- 
ления неизвестных свойств и параметров совокупности. Однако, 
что считать здесь большим, зависит от этих свойств и параметров. 
Во избежание порочного круга вводится понятие достаточного 
объема выборки, которое мы рассмотрим в $ 5.3. 


5.1.2. Количественные характеристики 
генеральной совокупности и выборки 


Цель выборки исчерпывается получением сведений о генераль- 
ной совокупности. Поэтому совокупность и выборка должны 
содержательно и формально характеризоваться на качественном 
уровне одними и теми же свойствами, параметрами и их систе- 
мами, а на количественном уровне — одними и теми же числовыми 
и функциональными мерами. В этой связи можно подвести итоги 
основным средствам формального описания случайных явлений, 
рассмотренным в предыдущих главах, разделяя все количественные 
характеристики совокупностей и выборок на две группы: пара- 
метрические (числовые) и непараметрические (функциональные), 
‚а затем классифицируя их, как показано на рис. 5.1.2 и 5.1.3. 

С формальной точки зрения различия между выборкой и гене- 
‘ральной совокупностью могут состоять в следующем. 

1. Выборка есть система с меньшим числом описывающих 
факторов (событий, величин, функций), чем генеральная совокуп- 
ность, — такая выборка нерепрезентативна (или малорепрезен- 
тативна). 

2. Функциональные характеристики выборки отличаются от 
соответствующих характеристик в генеральной совокупности. 
В зависимости от степени (приемлемости) отличий оценивается 
репрезентативность выборки. 

3. Параметры выборки отличаются от параметров генеральной 
совокупности, причем степень отличия (приемлемая или нет) 
выражает репрезентативность выборки. Так как многие функци- 
ональные характеристики могут быть определены через параметры, 
оценивание параметров генеральной совокупности посредством 
параметров выборки наиболее распространено. 

Нетрудно понять, что все указанные различия в конечном 
счете по степени находятся в обратной зависимости от объема 
выборки. Действительно, на рис. 1.1.1 было показано, как изме- 
няются средние значения частости появления цифры 47» от BH- 
борки к выборке (объемом п = 50). На рис. 1.1.2 можно видеть, 
что размах, характеризующий рассеивание выборочных средних, 
уменьшается при увеличении п. В общем случае при небольших п 
от выборки к выборке меняется и форма распределения случайных 
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Рис. 5.1.2. Классификация параметрических характеристик совокупностей и выборок. 
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переменных. Так что, например, из нормально распределенной 
совокупности можно при малом п получить TEPE ы распре- 
деления любой произвольной формы. 

Возвращаясь еще раз к определению частости как отноше- 
нию частоты (f) к числу наблюдений (п), подчеркнем ее смысл. 
Частость означает, что событие (число) в массе серий (выборок) 
по N испытаний в среднем встречается f раз. Это, следовательно, 
не исключает того, что оно вообще не встретится или встретится 
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Рис. 5.1.3. Классификация непараметрических характеристик совокупно- 
стей и выборок. 


все п раз: 0 = f < и, как следует из определения частости и бино- 
миального закона распределения. Но тогда очевидно, что редкие 
события можно наблюдать при большом п, так как они лишь 
случайно могут появиться в выборке с малым п. Наоборот, в малой 
выборке преимущественно появляются частые события. 

Теперь представим себе, что объем генеральной совокупности 
N позволяет сделать большое число (R) случайных выборок малого 
объема n, (NÐ® n, 1=1, 2, ..., В). Будем «вычерпывать» 
объем М выборками объема п;, тогда при зависимых испытаниях 
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R ‘ 
= Ут - Если допустить, что изучаемый параметр в генераль- 


i=1 
ной совокупности распределен нормально, тогда, при условии 


случайного отбора, очевидно, что с вероятностью 0,683 примерно 
две трети всех выборок охватят лишь значения неизвестного 
параметра 0 в пределах 0 + ози лишь 0,046 всех выборок охватят 
значения параметра в пределах 0 < — 20% и 0 >> 20%. Отсюда 
следует практически важный вывод. Функцию распределения 
параметра в генеральной совокупности можно получить двумя 
путями: 1) композицией многих случайных выборок малого 
объема, а потому в отдельности нерепрезентативных; 2) отобра- 
жением одной большой случайной выборкой, объем которой доста- 
точен для ее репрезентативности. В этой связи подчеркнем два 
обстоятельства. 

1. Случайная выборка обеспечивает равновероятный выбор из 
разных подобластей области. определения параметра в генераль- 
ной совокупности, тогда как неслучайная выборка может сместить 
выбор преимущественно в одну из подобластей, исказив тем самым 
результаты исследования так, что это искажение будет трудно 
или невозможно учесть и скорректировать. 

2. Две (или несколько) случайных выборок малого объема, 
взятые из однородной совокупности, в свою очередь, одно- 
родны; но взятые из неоднородной совокупности могут быть одно- 
родными или неоднородными в том смысле, что одинаковым или, 
соответственно, неодинаковым образом отображают гетерогенную 
совокупность. Поэтому однородность двух (и более) выборок сви- 
детельствует в пользу того, что они относятся к одной и той же _ 
генеральной совокупности, а неоднородность свидетельствует 
только о том, что эти выборки не из однородной совокупности. 


5.1.3. Погрешноети статистических оценок. 


Параметрические характеристики выборки принято называть 
оценками в отличие от параметрических характеристик совокуп- 
ности, которые называются параметрами. Таким образом, сред- 
нее арифметическое значение выборки есть оценка среднего 
арифметического значения генеральной совокупности; частость 
(эмпирическая вероятность) — это оценка вероятности, и т. д. 
Понятно, что. величина оценки может отличаться от величины 
параметра во всех случаях, если объем ‚выборки. меньше объема 
совокупности. При этом в силу случайности отбора. элементов 
в выборку любая оценка является случайной величиной. Действи- 
тельно, пусть имеется большое число R выборок фиксированного 
объема п; (1 = 1, 2, ..., В), в каждой из которых определена 
оценка £; некоторого параметра 09 генеральной совокупности. 
Флюктуируя от выборки к выборке, значения t, распределяются 
в некоторой области возможных значений tmin S Ô < fmax с Be- 
роятностями P (O < &), совокупность которых образует функцию 
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распределения F (t) произвольного вида. Если 0 — величина 
Sa. то существует и плотность вероятности f(t) = 


P (и 9 Е t u), где P (ЦЗ 0s t tà) — вероят- 


с параметру. со быть оцененным по выборке значениями t; на 
интервале квантования /,. Таким образом, оценка Ё некоторого 
параметра 09 является «полноправной» случайной величиной 
и описывается уже рассмотренным аппаратом качественных свойств 
и количественных характеристик. 

_ Для распределений оценок принято учитывать свойства NOJO- 
жения, рассеивания, асимметрии, а также связи (в случае выборки 
о схеме зависимых испытаний). При этом используются соответ- 
ствующие меры, в частности, среднее арифметическое значение 
оценки как мера ее положения, дисперсия и стандартное отклоне- 
ние оценки как меры ее рассеивания. 

С учетом этих свойств распределения выборочной оценки 
обычно выделяют два вида оценивания: точечное и интервальное 
(доверительное). Гочечное оценивание основывается на учете поло- 
жения, рассеивания, а также асимметрии распределения оценки. 
Мерой здесь служит математическое ожидание параметра 9, 
‘определяемое для конечных по объему CONgRyANOCTEÄ как среднее 


арифметическое из оценок &: М [9] = У ЕР ЕО Е-А)) 
т. 
и для В — a: М9] =f t-f (1) dt. Таким образом, математиче- 


1 
ское ожидание параметра есть среднее арифметическое из оценок, 


которые, в свою очередь, являются выборочными средними из зна- 
чений параметра, т. е. это средние из средних. 

В предыдущих главах мы рассматривали значительное число 
разных мер положения, рассеивания и т. д. (см. рис. 5.1.2). 

Какие же из этих мер более всего подходят для оценки соответ- 
ствующих параметров совокупности? Выбор оценки должен бази- 
роваться на совокупности трех критериев, предложенных Р. А. Фи- 
шером. С позиции этих критериев оценкам приписываются 


свойства состоятельности и эффективности, несмещенности и RIRE 


точности. 
Оценка £ является состоятельной (или подходящей) для пара- 


метра 0, если limt = 0, где n — объем выборки, а М — объем 
n>N ; 


совокупности. Иначе говоря, при n —> N, вероятность различия 
. t — 0 стремится к нулю, если {Е — состоятельная оценка 0. 
Большинство из рассмотренных нами оценок являются состоя- 
тельными. Поэтому, чтобы выбрать из них наилучшую, учитывают 
дисперсию D (t). Эффективной называется оценка, у которой 
наименьшая дисперсия. Степень эффективности оценивают диспер- 
сионным отношением: F = De (t) : D, (1, где D, (t) — большая 
и D, (| — меньшая по величине дисперсии Е Чем больше 
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отличается F от единицы, тем эффективнее оценка t, имеющая 
D (1) *. Оценка должна быть несмещенной, это означает, что 
M [t] = 0 — математическое ожидание выборочной оценки равно 
значению параметра в генеральной совокупности. Здесь еще раз 
отметим, что несмещенность оценок обеспечивается, во-первых, 
симметричностью их распределений, а во-вторых, случайным отбо- 
ром. Оценка, наконец, должна быть достаточной в том смысле, 
что никакая другая оценка не дает дополнительной ‘информации 
об изучаемом параметре. - 

Представление об указанных свойствах для некоторых мер 
(из числа рассмотренных нами) при их использовании -в качестве 
оценок можно получить из табл. 5.1.1. В этой связи принято CUM- 
тать, что наилучшей (в смысле выполнения критериев) оценкой. 


Таблица 5.1.1 
Свойства точечных оценок 


Оценка о: Эффективная |Несмещенная | Достаточная 
Частость (к Да Да _ Да Да 
МЫ) ее Да Нет Да Нет 
Медиана (Ме) ..... Да Нет Да Нет 
Среднее арифметическое s 

(M) ее Да Да Да Да 
‚Дисперсия (0)-.... Да ‚ Да Нет Да 
Стандартное отклонение 

а Да Да Нет Да 
Коэффициент `‘сопряжен- 

ности Чупрова (К) Да Да Да Да 
Коэффициент корреля- 

ЦИИ Е : 

cak ЕН Да Да Нет Нет 


положения является среднее арифметическое. Оценки рассеивания 


и связи уже удовлетворяют лишь части критериев. Несмещенной 
оценкой дисперсии генеральной совокупности является величина 


n 
l = eD, где D — выборочная дисперсия, n — объем вы- 


борки, $ — оценка стандартного отклонения. Заметим, что 5? 

не является выборочной дисперсией. Это просто случайная вели- 
чина, служащая несмещенной оценкой генеральной дисперсии, 
но смещающая выборочную дисперсию на величину п : (n — 1). 
Легко понять, что с УВоиНениВИ п отношение п: (п — 1) быстро 
сходится к единице, и $? — сходится к o? = D. Наиболее 
распространенная линейная мера корреляции — коэффициент 
Бравэ—Пирсона г;, является смещенной оценкой, причем смещение 


* Более подробно дисперсионное отношение F будет рассмотрено 
в 5,2. 
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увеличивается с увеличением модуля значения |r; |, как видно 
из рис. 5.1.4. В этой связи в качестве несмещенной оценки ис- 
пользуется предложенное Р. А. Фишером 2-преобразование 


zy =0,5ln ШИ, (5.1.4) 


где ш — натуральные логарифмы, a z;; — определяется для Г}; 
по табл. Ш Приложения 2. 

_Для построения оценок, удовлетворяющих указанным выше 
критериям, Р. А. Фишер разработал статистический метод точеч- 
ного оценивания — это ме- 
тод максимального правдо- 
подобия, который мы рас- 
смотрим в $5.3. 

Интервальное (довери- 
тельное) оценивание базиру- 
ется на учете рассеивания, 
преимущественно симметрич- 
ного. Существо этого способа 
оценивания состоит в том, 
чтобы указать доверительный 
-] -0.5 0 0,5 1 интервал: 


Рис. 5.1.4. Распределение выборочной t; — ta 0 (09) == Е -Е&-о (6), 
оценки (г) коэффициента линейной кор- 


реляции (г), при объеме коррелируе- (5.1.5) 
мых выборок п; = 12. 

По оси ординат — п, по оси абсцисс — в котором 0 — значение nc- 

ry 1 — r= 0; 2—7 = 0,4; 3 — F= 0,8. KOMOTO параметра заключено 


с доверительной — вероят- 


ностью 1 — &, если o (0) — стандартное отклонение параметра, и 
t, — квантиль распределения параметра, отсекающий слева и 
справа долю вероятности, равную %. Обычно принимают Q = 
= 0,05; 0,01; реже & = 0,10 и 0,004. Смысл интервального оцени- 
вания параметра (на примере арифметического среднего) поясняет- 
ся на рис. 5.1.5. | 

На основе интервальных оценок параметров, образующих функ- 
циональную характеристику, осуществляется оценивание довери- 
тельной области и для функциональной характеристики совокуп- 
ности. Наиболее распространено построение доверительной области 
для простой регрессии (рис. 5.2.5), что будет рассмотрено ниже. 

Для изучения интервальных оценок необходимо уметь вычис- 
лить о (0) — стандартные отклонения параметров, которые при- 
нято называть стандартными, ошибками (погрешностями) выбороч- 
ных оценок параметров. Определение этих ошибок зависит от 
многих факторов, но прежде всего от объема выборки. Сводка 
формул для оценки стандартных погрешностей многих параметри- 
ческих характеристик представлена в табл. 5.1.2. Там же даны 
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соответствующие разъяснения. Дополнительно заметим, что, строго 
говоря, применение стандартных погрешностей законно лишь тогда, 
когда распределение статистик сходится к нормальному закону. 
Но это выполняется для разных статистик с различной скоростью. 


f(t) 


Рис. 5.1.5. Пояснение интер- 
вального оценивания. 


а — плотность ыы рас- 
пределения оценок t; параметра 0 


t= 
o0)’ 
где o(0)= VD(X):n, 1—a— 
доверительная вероятность, t sa N 


квантили распределения f (t), 0 — 
математическое ожидание парамет- 
ра в совокупности, D (X) — выбо- X 
рочная дисперсия, п — объем вы- f ( ) 
борки; 6 — плотность распределе- 
вия изучаемой случайной величи- 
ны Х, параметр которой оцени- 
вается (в данном случае — это 
среднее арифметическое значение); 
0 = M (Х); d (t) — доверительный 
интервал (5.1.5) в стандартном ма- 
сштабе: d (0),= t; Fit o (0) 


в стандартном масштабе: t= —— 


9.1.4. Надежность статистических оценок 


‚В отличие от обычного предположения научная гипотеза яв- 
ляется предположением, допускающим практическую проверку. 
хотя бы в будущем. Статистическая гипотеза — это научная гипо- 
теза, допускающая статистическую проверку. Под статистической 
гипотезой обычно понимают формальное предположение о том, что 
сходство (или различие) некоторых параметрических или функ- 
циональных характеристик случайно (или, наоборот, неслучайно). 
Поэтому содержательные предположения по поводу исследуемых 
явлений должны быть переформулированы определенным образом. 
Например, изучается влияние на время реакции (и) фактора zZ. 
Пусть имеются две серии опытов: экспериментальная, где Z # 0, 
и контрольная, где z = 0. Обычная научная гипотеза в такой ситуа- 
ции гласит: фактор 2 влияет (или не влияет) на время реакции. 
Статистическая гипотеза формулируется иначе: безусловное рас- 
пределение времени реакции F (и) неслучайно (или случайно) 
отличается от условного распределения F (и/2). В дальнейшем 
изложении будут приведены и другие формулировки статистиче- 
ских гипотез. 

Проверка статистической гипотезы состоит в том, чтобы опре- 
делить вероятность случайности или неслучайнос ти различий (или 
сходства). При этом гипотеза о случайности (все равно различия 
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Стандартные погрешности статистического оценивания параметров 


п — везде объем выборки 


‚Оцениваемый параметр 


Таблица 5.1.2 


SEEE aaa 


Формулы стандартной погрешности 


Обозначения и условия применимости 


Вероятность события (значения 
величины): Р(А); Р(А/В); 


Плотность вероятности f (2) 


Медиана Ме 


Квартиль О; &=1, 3) 


Начальный момент 
пени ть 


к-той CTE- 


Для параметров возможности 


ГИР, 


pa aaa 
V +r æn- o 


MAN aT a 


Для параметров положения 


({ 0,5 


Для вероятностей событий, 


для функций распределения 


Для плотностей распределения 


Yọ —ордината плотности, 


соответ- 
ствующая медиане, 


с— стандартное отклонение HOP- 
мально распределенной гене- /- 
` ральной совокупности 


То же 


В любых условиях 


78 < 


II родолжение табл. 5.1.2 


Оцениваемый параметр Формулы етандартной погрешности Обозначения и условия применимости 
Среднее арифметическое значе- М (Хх) = o (X) | о (Х) —стандартное отклонение в Tre- 
ние М (Х) o [М (Х)] = и неральной совокупности. Если 


оно не известно, то заменяется 
| выборочной оценкой 5 (Х) 
Разность двух средних арифме- 


S 2 (X o2 (X ny — JIA выборки Xı и Nng— для BH- 
тических значений M(X) u| a (|M (x) —M (Xa) = / СЫ. Mapen Xa; o (X1) 1 0 (Xa) — erene- 


- M (Xə) na ральные» стандартные отклонения 
То же | $ {| M (Х1) —М (X2)| } = 
р т j Ns 
È [z:—M (хору М (X2)]? 
= rd m Jaha Если o (X1) n o (X2) не известны 
nı + ng —2 nı’ m г Daty 


Для параметров рассеивания 


саж Ga 


Размах распределения 4 o (d) = matm Без ограничений 
Сумма ты отклонений | 
И zz 3,14; © (пбу) —так называемый 
пб, = У |z;—M (X)| и n ; 
x 2 i o (nôx) ой коэффициент Питера 
Среднее арифметическое отклоне- с (8) = 9 (2) у мы И | Для нормального распределения c 
ние Ô a n с «генеральным» стандартом O (=) 
X 


C86 


Разность двух выборочных | 09/152 62 25152 
v — = а независимых выбо ок равного 
дисперсий | 5} — 5} | (151—531) Ув 2 ооо, Гр RORY 
5953 Ив Е для независимых выборок неравных 
(nı +n2— 2) nın объемов п1 и Ng 
Коэффициент. вариации Mnp- Ре BEE Позы ИВ, о 
сона У (B %) an= 1 E д 2( y | В асимптотически нормальном слу- 
95 2n 100 чае | 
Для параметров асимметрии и эксцесса 
эфат - я 6 (n—1) у 6 Приближение допустимо при боль. 
НА асимметрии Аз с (Аз) = ре” т PS | 
Коэффициент эксцесса Ех о (Ех Е pani , То же 
ppan я (Ех) У 1-3) NTI И nap 


Продолжение табл. 5.1.2 


Оцениваемый параметр Формулы стандартной погрешности Обозначения и условия применимости 


pa RERA 
ate 2 


| ри 
Стандартное отклонение O (X) F10 1491 =0;5: LAS 


i Для любого, 
Дисперсия D o (2) = 


для нормального распределения 


В любом случае 


Приближенно—в случае асимпто- 
тически нормального распределе- 
ния, точно —для нормального 


= 


( 1—2 
12 
25152 и и, 


Для зависимых выборок равного 
объема, 


—_—————————————————ПЙЙЙбб—ШШбЖж——— 


о 


$86 


П родолжение табл. 5.1.2 


Оцениваемый параметр 


Формулы стандартной погрешности 


Обозначения и_условия применимости 


Коэффициент ранговой корреля- 
ции Кендалла T 


Коэффициент ранговой корреля- 
ции Спирмена p 


Коэффициент детерминации N ja 


Коэффициент линейной корреля- 
ции Бравэ-Пирсона гу; 


2]— преобразование. Фишера 
для rij i 


Для параметров связи 


о (%) = 


4 1/ 48-10 
3 (1) 


В предположении, что ранжирована 
непрерывная переменная 


и— функция, 2—аргумент, N— 
число рассматриваемых  значе- 
ний и, из которых вычислен NÈ т. 


Формула Пирсона — Филоно для вы- 
nepa n >00, 
при n œ> 100, | \ 


при п < 100 


Для любых условий 


78 <. 


П родолжение табл. 5.1.2 


Оцениваемый параметр 


Разность 2-преобразований: 
| 21 — 22 | 


Степень линейности простой рег- 
рессии, — определяемая pas- 


ностью: и, — Гу, 


Угловой коэффициент простой 
линейной регрессии aĝ, 


Свободный "член простой линей- 
ной регрессии apy 


Формулы стандартной погрешности 


Обозначения и условия применимости 


При отсутствии (или неучете) 
частных корреляций первого и 
более высоких порядков 


2 
= [1—(n2?—r?) (2—n?—r?)],| В зависимости от ‘объема выборки, 


и Ра ny +na— 6 
PTR 9:3) 
. yE 
n 
с (ши. Гиг)= МИ N 
12—72 
N3 


o (аи) = 


o (aou) Gie 


и 


o (и) (1—3, 
o (2) V n—2 ’ 
б (и) ; 1 иг. 

О jary 


—5: Уш-м Е 
1=1 
М (и)? 
тм 
У, [z:— M (=) 


1=1 


в зависимости от числа N pac- 
сматриваемых значений и 


При малых п < 100 и 


при больших (п > 100) выборках 


982. 


П родолжение табл. 5.1.2 


Оцениваемый параметр Формулы стандартной погрешности Обозначения и условия применимости 
Коэффициент множественной | | у TREET E 
нелинейной детерминации в (nÈ 23... м)= MAS REE PEAT, VARA N — число величин в системе 
121.23.. АМ 
Мел и i EAR А То же 
Коэффициент множественной ли- о (К; оз... м)= MEE pinay Я 
‚ нейной регрессии Ri s3.. N n—N 
м 
ов а При малых п < 100 и 
z yr v n TTN 
Коэффициент частной корреля- y к 
ии Г, ; | (rA 23... м) = 
ЦИИ 7;; 03... М 1—2; 23... м ; 
МЕН E E mint OAA AMD при больших (n > 100) выборках 
Vn=N 
; a i DE 2 i te 
Bii — коэффициент множественной o (Bi) 1— R}, 23... N 
Ной О ро ем и 
линейной коррессии (1—4). 03... м) ON) 
Парциальный коэффициент мно- мм м о 
жественной линейной регрес- o (aij) = 0;. og N Не лы 
сии Gij 9.03... мп —Х ляются из формулы (4.1.15) 


YA 


985 
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H родолжение табл. 5.1.2 


Оцениваемый параметр ` Формула стандартной погрешности Обозначения и условия примени’.ости 
AN? = n? —n? 
SIERT AE EPI EE T hi 28au N Mara. N 
P OT ито в (Ana) = (Anil где М: и М№ — uncio случайных 
детер M РМ аргументов. Справедливо и для 
Ania 


’ линейной регрессии 


Для величины функционально характеризуемого параметра - 


| Для регрессии и=\ф(2) любой 
Теоретическое значение услов- рН формы; с (и) — стандартное откло- 
и un a poera s =o (9 VTE ienne ово momo, aa- 
POr penoa. | 12 ,„— коэффициент детерминации 


i 


[ N N 
To же B линейной множествен- 3 > ajaj COV ( Х.Х,), в общем случае, 
ной регрессии: iad 7=1 
х Е 
tN Y, N 
u” = Zj А; при независимых слагаемых 
= | и У. 20 [ХЛ F | 
1=1 


сии произвольной формы: и У У р 0% X; ôXj 
0: (и*) = 
J му аргументам COOTBeETCTBEHHO 


и* = (Х1Х....Хм) 5х: oX, COV (Х;Х;) ные функции p по i-TOMy и ]-то- 
{ 


или сходства) называется «нуль-гипотезой (H), а гипотеза” 
о неслучайности называется альтернативной (H). Заметим, что. 
проверка предполагает, во-первых, сомнение в истинности гипотезы. 
и, во-вторых, наличие хотя бы двух возможных исходов: принять 

гипотезу или отбросить ее. Следовательно, можно рассматривать 

систему из двух альтернативных событий, одно из которых состоит 

в объективной истинности или ложности гипотезы, а другое — 

в ее субъективном принятии или отбрасывании. Тогда, в соответ- 

ствии с табл. (1.3.1) можно построить табл. 5.1.3, в которой пред- 

ставлены вероятности событий при альтернативной проверке ги- 

потез. Все эти вероятности имеют фундаментальное значение в мате- 

матической статистике, поэтому рассмотрим их подробнее. 

Вероятность принятия истинной гипотезы P (П/Й) = 1 — & 
уже упоминалась выше как доверительная вероятность. Можно 
видеть, что это условная вероятность верного принятия истинной 
гипотезы. 

Вероятность отклонения истинной гипотезы P (O/M) = 
это условная вероятность ошибочного отбрасывания истинной ги- 
потезы. Ошибка исследователя, заключающаяся в отклонении 
проверяемой гипотезы, если она объективно истинна, называется 
ошибкой первого рода. Эта ошибка в прикладных исследованиях 
часто интерпретируется как пропуск сигнала наблюдателем или 
как прием бракованных изделий заказчиком от поставщика. 
Поэтому вероятность Q называется вероятностью ошибки первого 
рода, пропуска сигнала (цели) или риском заказчика. | 

Вероятность принять ложную гипотезу P (ШЛ) = В — это 
условная вероятность ошибки исследователя, состоящей в том, 
что ложная гипотеза принимается за истинную. Такая ошибка 
‚ называется ошибкой второго рода и часто интерпретируется как 
ложная тревога или отклонение заказчиком небракованных изде- 
лий. Поэтому вероятность В называется вероятностью ошибки 
второго рода, ложной тревоги, или риском поставщика. 

Вероятность отклонить ложную гипотезу P (О/Л) = 1 — В — 
это условная вероятность верного отбрасывания гипотезы исследо- 
вателем, если она объективно ложная. 

Заметим, что рассмотренные условные вероятности могут быть 
определены на основе опыта и тогда называются апостериорными, 
но могут быть выбраны априори, на основе имеющейся информации 
и тогда называются априорными. 

Вероятности истинности и ложности гипотез тоже могут быть 
априорными и апостериорными. Очевидно (табл. 5.1.3), что: 


P (1) = P (I/M) +P (0/1), 


5.1.6 
P (JI) = P (ШЛ) + P (0/Л), Pa 


а также | 
P (ПИ) =Р(И).Р(П/И), Р(ОИ)=Р(И).Р (0/М), 
Р(ПЛ)=Р(Л).Р(П/Л), Р(ОЛ)=Р(Л).Р(О/Л), (5.1.7) 
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Вероятности событии при альтернативной проверке гипотез | Таблица 5.1.3 


Объективно | 
р Гипотеза истинна (M) Гипотеза ложна (Л) роли 
Субъективно | | цсх0д08 


Р(и/п)= P(A/N) = 


(mæ) P(n) 
(1-œ)P(n)+B P(A) 


Принятие 
гипотезы 


< (n) 


BP(A) 
(1-«)Р(И)+ВР(Л) 


Р/пл= 


ре =(1-œ) P(n)+ 


= (1-е) P(n) ` RAPA) 


Р(и/о) = P(4/0) = 


(1 —В) EIA) 
&P(n)+(1-B)P(A) 


œ P(n) 


й сР(И)+ (1-В)Р(Л). ве 


Отклонение 
гипотезы 


(0) 


| 


= с Р(И)+ 


P(A) = 
Р(0^) = 


я (1-В)Р() 


| L PARI +2(0)=1 


tiy +(1-B)P(A) 


| Вероятности — 
| гипотез 


откуда определяются и безусловные вероятности: P (I) — apana- 
тия и P (O) — отклонения гипотезы, которые обычно устанавли- 
ваются апостериори. 

Условные вероятности P (ИЛТ, P (JIA), P (ИЮ) a P (ЛО) — 
это так называемые апостериорные вероятности гипотез (или 
истинности и ложности гипотез). Они определяются на основании 
принципа Байеса (см. раздел 5.3.1) и служат для уточнения апри- 
орно выбираемых безусловных вероятностей истинности и лож- 
ности гипотез P (И) и P (Л). 

Поведение исследователя, проверяющего статистическую гипо- 
тезу, может быть верным и неверным. Верное поведение (событие 
ВП) объединяет принятие объективно истинной гипотезы (событие 
ПИ) и отклонение ложной (событие ОЛ). Неверное поведение (собы- 
тие НП) объединяет ошибки первого (ОИ) и второго (ПЛ) рода. 
Тогда вероятности верного и неверного поведения выражаются 
следующим образом (табл. 9.1.3): 


P (ВП) = P (IM) + P (ОЛ) =Р(И) (1 — a) + (1—В)Р (Л), 
P (HI) = P (JI) + P (OM) = P (M) a + ВР(Л), (5.1.8) 
P (BII) + P (HO) =4. 


Отсюда можно видеть, что при фиксированных значениях 
P (И) иР (Л) вероятности верного и неверного поведения непосред- 
ственно зависят от Œ и В-вероятностей ошибок первого и второго ` 
рода. Поэтому, задаваясь подходящими значениями © и В, можно 
максимизировать Р (ВП) или минимизировать Р (НП). Практиче- 
ски важным, в этой связи, является вопрос о выборе величин Q 
и В, учитывая величины Р (И) иР (Л). Здесь выделяют следующие 
случаи. 

Симметричные гипотезы — при P (И) ~ P (Л). Заметим, что 
из (5.1.8) тогда имеем: | 


Р(ВП)=1—0,5 (a+b), о. 


т. €. верное поведение зависит лишь от & и В, причем при прочих 
равных условиях безразлично: & = В, & > В или а < В, лишь бы 
сумма & + В была поменьше. 

Несимметричные гипотезы — при P (И) ® P (JI). Здесь nono- 
жение иное. Если P (И) D P (Л), то P (ВП) определяется преиму- 
щественно первым слагаемым в правой части (5.1.8) даже upna = 
= В. Но можно еще увеличить P (ВП), уменьшая %, хотя бы и за 
pr В, T. е. выгодно выбирать Q K р. Если же наоборот, P (И) « 

P (Л), тогда P (ВИ) преимущественно определяется вторым сла- 
ни в (5.1.8), и следует максимизировать его, уменьшая В, 
т.е. выбирая & » В. 

Таким образом, выбор стратегии поведения исследователя при 
проверке статистической гипотезы определяется наличием априор- 
ной информации о Р (И) иР (Л) — об истинности или ложности 

проверяемой гипотезы. Если таковая информация полностью 
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отсутствует, то выгодно считать P (Л) = P (И) и, минимизируя œ 
и В, одинаково часто принимать решение об истинности и ложности 
гипотезы. При наличии верной, априорной информации выбирают 
œ < В или, наоборот, соответственно P (И) >P (Л) или P (И) < 
< Р (Л). Но такой выбор усугубляет дело при неверной априорной 
информации. В этой связи ŒQ и В выступают в качестве непосред- 
ственных мер ненадежности, а вероятности 1 —ями 1 — В — 
в качестве мер надежности статистических оценок. 


2.1.2. Задачи статистической проверки гипотез 
в пеихологических ‘исследованиях 


Первой основной задачей, по нашему мнению, является репре- 
зентативное выборочное описание свойств генеральных совокупно-_ 
стей. Учитывая сказанное выше о различиях между выборками 
и генеральными совокупностями, ясно, что для такого описания 
значительных по объему совокупностей психических свойств, со- 
стояний, процессов и функций требуется накопление огромного 
выборочного материала или проведение исследований в национальв- 
ном масштабе. Несмотря на большое число экспериментальных 
исследований, накопленный материал все же нельзя считать до- 
статочным, а исследования в национальном масштабе слишком тру- 
доемки и сложны для проведения. Поэтому задача репрезентатив- 
ного описания, предполагая накопление материала, сводится 
ко второй основной задаче, а именно — к задаче проверки одно- 
родности выборочных описаний, полученных в разных исследова- 
ниях, и к объединению однородных данных. Заметим в этой связи, 
что для проверки однородности необходимы, во-первых, однооб- 
разность статистических описаний одних и тех же психических 
явлений разными авторами и, во-вторых, — указание в публика- 
циях на величину объемов выборок, из которых вычислялись ста- 
тистические оценки параметров и функций. 

Можно выделить также ряд частных задач, способствующих 
решению указанных основных. Для любых генеральных совокуп- 
ностей это, во-первых, сопоставление выборочных параметриче- 
ских и функциональных характеристик с аналогичными характе- 
ристиками известных генеральных совокупностей (или, по крайней 
мере, — с выборками большего объема); во-вторых, это аппрокси- 
мация функций распределения и связи теоретическими кривыми. 
Для гетерогенных совокупностей это выявление структуры совокуп- 
ности (в частности, определение числа существенных переменных, 
необходимого и достаточного для описания совокупности); опреде- 
ление вида и характера связей между переменными и минимиза- 
ция числа переменных. Дальнейшую деталировку задач можно 
проводить в соответствии с конкретными видами параметрических 
и функциональных характеристик совокупностей и выборок 
(рис. Э.1.1.—5.1.3). 
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Резюмируя, подчеркнем, что задачи статистической проверки 
гипотез являются необходимой частью научных задач, стоящих. 
перед психологами и представителями смежных наук, но не исчер- 
пывают всего множества таких задач. Поэтому формальные методы 
математической статистики должны не заменять, а дополнять 
содержательные методы психологических дисциплин. 


$ 5.2. СТАТИСТИЧЕСКИЕ КРИТЕРИИ ОЦЕНИВАНИЯ И 
ПРОВЕРКИ ГИПОТЕЗ 


9.2.1. Понятие о статистических критериях 


Под критерием вообще понимается решающее правило, обусло- 
вливающее поведение в ситуации выбора. Статистическим крите- 
рием (в отличие от других научных критериев) называется правило, 
обеспечивающее надежное поведение, т.е. принятие истинной 
и отклонение ложной гипотезы с высокой вероятностью. 

В качестве критериев в математической статистике исполь- 
зуются определенные случайные величины, которые являются 
неслучайными функциями от изучаемых случайных величин 
и от так называемого числа степеней свободы (стр. 294), завися- 
щего от числа наблюдений. Пусть критерием является случайная 
величина У* = p (0*, v), где ф — неслучайная функция от napa- 
метра 0* и числа степеней свободы v. Должна быть известна функ- 
ция распределения F (Ух, v), которая обычно табулируется (как 
это сделано в табл. УП-—Х Приложения 2). Тогда использование 
критерия У* для оценки 0 параметра 0* или проверки статистиче- 
ской гипотезы об этом параметре состоит в следующем. 

При оценке неизвестного параметра 60* доверительным интер- 
валом (5.1.5) для выбранной & по таблицам распределения F (Ух, v) 
определяется теоретическое значение квантиля критерия Уз, v, 
которое показывает, насколько стандартных погрешностей о (6) 
может отклоняться значение параметра 9* OT ero выборочной оценки 
9 при данном числе степеней свободы (как функции от объема 
выборки): 


0 — Y$ o (0) = 0* = 0+ Y$ o (6). (5.2.1) 


При проверке гипотезы относительно 0* всегда в сущности 
проверяется вопрос, может служить O оценкой 0* или нет. При 
этом формулировать «нулевую» гипотезу можно относительно 
различия 0 и 6*: «различие случайно», но тогда альтернативная 
гипотеза формулируется относительно сходства: «сходство неслу- 
чайно». Можно, наоборот, формулировать «нулевую» гипотезу 
относительно сходства 0 и 0*: «сходство случайно», но тогда аль- 
тернативная гипотеза касается различия: «различие неслучайно». 
При такой классической (альтернативной) формулировке гипотез 
по выборке находят оценку параметра 0. По функции Y вычисляют 
эмпирическое значение критерия УЗ, а по таблице F (Уз, v) 
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находят для заданного Œ и обусловленного объемом выборки V TEO- 


ретическое значение квантиля r у И производят сравнение: 


TE У, или >Y: š: 


Смысл уравнения (5.2.2) в 
_ зависимости от данных выше 
формулировок статистических 
гипотез можно пояснить сле- 
дующим образом. Вспомним, 


что квантиль To есть значение 


Рис. 5.2.1. Пояснение сопоставления 
эмпирического и критического зна- 
чений квантилей. 


1 — эмпирическое, 2 — теоретическое 
распределение. По осям ординат — плот- 
ности вероятности f (У), по осям абсцисе— 

. а-— незаштрихованная площадь под 
кривыми равна ©; YƏ < = s и различие 


считается случайным, а сходство неслу- 
чайным; 6 — незаштрихованная площадь 
под кривыми равна 1 — &; Y? > Ха. и 


сходство считается случайным, а разли- 
yne неслучайным; в — заштрихованная 06- 
ласть нересечения мала для 1 — чи Be- 
лика для &, при этом ya, RE > < Y? a 
где Qe — Qı — интервал неопределенно: 
чтобы обоснованно принять или отклонить 
гипотезу, необходимо провести дополни- 
‚ тельные наблюдения. 


(5.2.2) 


Рис. 5.2.2. Пояснение односторон- 
них и двусторонних критериев. 


а — двусторонний критерий; ординаты 
Ys 0, 5a слева и справа называются крити- 


ческими значениями соответственно «сни- 
зу» и «сверху»; б — односторонний крите- 
рий, y* — критическое значение снизу, 


в —односторонний критерий, у* — крити- 
ческое значение сверху. 


переменной У, которому соот- 
ветствует доля площади под 
кривой плотности, численно 
равная вероятности Œ. Тогда, 
изображая вероятности Q и 
1 — &, как показано на ри- 
сунке 5.2.1, а, 6, и учитывая 


табл. 5.1.3, можем записать правила выбора. Если УЗ = Тито 
к 

различие 0 и 0* случайно, а сходство неслучайно (рис. 5.2.1, a), 
следовательно, принимается гипотеза о сходстве. эмпирической 
оценки 0 с теоретическим параметром 6*. Если же Y° > Ух», 

область Œ 

то сходство Ô и 0* случайно, а различие неслучайно (рис. 5.2.1, 6), 
следовательно, принимается гипотеза о различии между оценкой Ô 
и параметром 0*. Заметим, что, проверяя в качестве «нулевой» 
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гипотезу о сходстве, мы принимаем альтернативную гипотезу 
о различии и, наоборот, проверяя в качестве «нулевой» гипотезу 
о различии, мы принимаем альтернативную гипотезу о сходстве, 
т. е. статистическую гипотезу проверяют доказательством «от про- 
тивного». 

Среди` возможных статистических критериев выделяют: одно- 
сторонние и двусторонние, параметрические и непараметрические, 
более и менее мощные. 

Понятие одностороннего либо двустороннего критерия связано. 
_ с формулировкой гипотез. Если «нулевая» гипотеза формулируется 


о равенстве (сходстве) O = 6*, то для проверки используется дву- 
сторонний критерий, теоретический квантиль которого Yg v 
определяется, в сущности, для 0,5%, как показано на рис. 5.2.2, а. 
Если же «нулевая» гипотеза формулируется о неравенстве (о раз- 
личии), то возможны три формулировки: 0 + 0*, 0 > 0* или 0 < 
< 0*. Для первой формулировки снова используется двусторонний 
критерий. Но для второй и третьей — односторонние. Смысл одно- 
стороннего критерия — это нижняя или верхняя границы довери- 
тельного интервала (рис. 5.2.2, 6 и в), соотвётственно говорят 
о нижнем критическом значении (рис. 5.2.2, 6) и верхнем крити- 
ческом значении (рис. 5.2.2, в) критерия у*. 

`Параметрические критерии — это некоторые функции от mapa- 
метров совокупности, они служат для проверки гипотез об этих 
параметрах или для их.-оценивания. 

Непараметрические критерии — это некоторые функции от 
функций распределения или непосредственно от вариационного 
ряда наблюдавшихся значений изучаемого случайного явления. 
Они служат только для проверки гипотез о функциях распределе- 
ния или о рядах наблюдавшихся значений. | 

Важнейшей характеристикой любого статистического критерия 
является его мощность. Под мощностью критерия понимается его 
способность правильно отбрасывать ложную гипотезу. Мощность 
оценивается вероятностью 1 — Ви, следовательно, согласно урав- 
нениям (5.1.8), зависит от вероятностей P (И), P (Л) и «а, так что 
один и тот же критерий может иметь разную мощность для разных 
сочетаний этих вероятностей. Функция, определяющая значения. 
1 —Вв зависимости от указанных вероятностей и числа наблюде- 
ний, называется функцией мощности критерия. Она позволяет, 
смотря по обстоятельствам, выбрать подходящий критерий для его 
практического использования, а также используется при разра- 
ботке новых критериев. 

_В математической статистике для различных приложений 
создано большое количество параметрических и непараметрических 
‘критериев, многие из которых маломощны или не определены по 
мощности. Поэтому в психологических приложениях лучше поль- 
зоваться сравнительно небольшим набором основных критериев, 
наиболее мощных в большинстве случаев. Их мы и рассмотрим ниже. 
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5.2.2. У?-критерий Пирсона 

Наиболее мощным непараметрическим критерием является 
критерий y2? по Пирсону. Пусть у1, Ya, ..., Yvy — независимые 
случайные величины, распределенные нормально со средним ариф- 


метическим, равным нулю, и дисперсией, равной единице. Тогда 
y 


сумма этих величин ys = ba у; распределена с плотностью, зави- 
#=1 


сящей только от V, как показано на рис. 5.2.3, и при увеличении V 
асимптотически стремящейся к нормальной плотности. 

Величина v называется числом степеней свободы. Остановимся 
на этом понятии подробно. В математической статистике под 
числом степеней свободы понимается число фактически возможных 
направлений изменчивости. В этой 
связи выделяются следующие по- 
HATHA. Число (теоретически) воз- 
можных степеней свободы; число 
«связанных» степеней свободы`и 
число «свободных», т. e€. факти- 
чески возможных степеней сво- 
боды. 

Число возможных степеней сво- 
боды есть количество наблюдений. 
Это. для отдельного события — 

О ЮВ 0 число случаев его появления и 
непоявления (п). Для отдельной 
Рис. 5.2.3. Плотность х*-распре- случайной величины — это вектор 
: делении значений величины числом ий, а для 
T PENS ananem y2; 1 — npu v 2  вариационного ряда — число клас- 
2 — пи у=4 из — при у= 10. сов группировки k. Для двумер- 
ной системы величин (или собы- 
тий) при несгруппированных данных — это N’, а при сгруп- 
пированных — это kyky. Наконец, в общем случае ‚М-мерной 
случайной системы — это общее число пересечений интерва- 
лов квантования L, определенное выше уравнением (4.1.6), причем 
величины k; и L являются функциями от числа наблюдений. 

Число «связанных» (несвободных) степеней свободы пони- 

мается следующим образом. Пусть суммируются n значений T; 


02 


0,1 


вектора X, результатом а является 5 Ti. Torga можно сохра- 
t1 


нять их сумму  факсированной при любом случайном сочетании 
п — 1 значения 4;, лишь бы одно из этих значений неслучайным 
образом дополняло остальные. Следовательно, одно значение яв- 
ляется «связанным», несвободным при всяком суммировании. 
Аналогично при г суммированиях связывается г степеней свободы. 
Заметим, что вычисляя г моментов распределения (считая нулевые 
моменты), мы суммируем г раз, так что для одномерного распреде- 
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ления с числом параметров l всегда «связывается» г = l -+ 1 cre- 
пень свободы. Так, для нормального, гамма- и биноминального 
распределений число связываемых степеней свободы: г = 3, для 
пуассоновского: г = 2. 

Число фактически возможных (свободных) степеней свободы 
(у) определяется разностью между числом теоретически возмож- 
ных и «связанных» степеней свободы. Для вектора значений (или 
вероятностей) случайной величины: у = п — 1, для ее распределе- 
ния, полученного группировкой наблюдений в Ё интервалов: 

= А —г, для таблицы М-мерного распределения вероят- 
ностей системы событий (или случайных величин): v = (n — 1х 
х (т — 1), где п — число строк, а т — число столбцов такой 
таблицы. 

Квантили )2-распределения для значений œ = 0,05 и 0,04 

=1, 2, ..., 1000 приведены в табл. УП Приложения 2. 
'Основные направления применений )?-критерия: а) сравнение 
сходства (различия) двух и более распределений; 6) оценка стоха- 
стической независимости (зависимости) систем случайных событий. 
и величин, а также сравнение матриц’ переходных вероятностей 
для оценки цепи событий как бернуллиевской или марковской 
(простой или сложной); в) проверка однородности парных 
корреляций; г) формирование других статистических крите- 
риев. 

С равнение двух распределений может осуществляться как срав- 
нение выборочного распределения с каким-либо теоретическим за- 
коном или как сравнение двух и более выборочных распределений. . 
В первом случае проверяется гипотеза о том, можно ли рассматри- 
вать отличия выборочного распределения от его теоретической 
аппроксимации данного вида как случайные, иначе говоря, AB- 
ляется ли выборочное распределение нормальным, гамма- или 
каким-нибудь другим. Во втором случае ставится вопрос о том, 
случайны ли различия между двумя или несколькими выбороч- 
ными распределениями (к какому бы виду они ни принадлежали). 
Рассмотрим оба случая на примерах. 

Пример 5.2.1. В примере 2.4.1 эмпирический ряд распределе- 
ния значений амплитуды установившихся колебаний руки человека 
был аппроксимирован нормальным распределением. Значения 
частостей р; и вероятностей р; приводились в табл. 2.4.1. Прове- 
рим для этих данных, пользуясь критерием %?, следующую «нуле- 
вую» гипотезу: отличия выборочного распределения частостей от 
теоретического нормального распределения вероятностей являются 
случайными. 

„При сравнении выборочного и апироксимирующего распределе- 
ний используется следующая формула Š ?-критерия: 


k k 
(1—1)? (Pr— p7) 

Я TE А E a — ‚м. 

$ = > F n > p7 (5.2.3a) 


i=1 $=1 
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_ или 


Е 2 k p? i > 
а ет — 7 > p? >= , i (0230F 


t=} 


где f; u ff — эмпирическая и теоретическая частоты {того интер- 


вала группировки; р; и р; — частости и аппроксимирующие 
вероятности; п — число наблюдений; пр: = fi» npl = ff; k— 
число интервалов ыы после объединения интервалов, 
в которых f; < 5. | 
> Так как два верхних интервала в эмпирическом распределении 
имеют частоты меньше пяти (см. табл. 2.3.11), то их следует объеди- 
нить, суммируя частости. Аналогично следует частость последнего 
интервала суммировать с частостью третьего снизу интервала. 


Соответственно суммируются, и вероятности pj. В результате для 


вычисления эмпирического XY? используются р; и Pi, ‚предотавлен- 
ные в табл. 5.2.1; там же показано и вычисление у? по формуле 
(5.2.3 а). | 

ne Таблица 5.2.1 
Вычисление y? к примеру 5.2.1 


[2;— 2: d 


* 
Pi | Pi 


(r; =r)? (рр) 


-0,025 0,018 0,006 0,000036 0.0025 


0,045 0,054 0,010 0,001000 0,0185 
0,125 0,119 0,006 0,000036 0,0003 
0,145 0,193 _ 0,048 0,002304 _ 0,0119 
0,290 0,234 0,059 0,003481 _ 0,0151 
0,185 0,193 0,008 0,000064 0,0003 
0,110 0,119 0,009 0,000081 0,0007 
0,075 0,072 0,003 0,000009 0,0001 
п = 200, 12 = 200. 0,0494 = 9,88, 
У=8—3=5, ` 


X? < Xd, 05/5 = 111 


Мы проверяем гипотезу о нормальном распределении, у KOTO- 


poro два параметра; значит, г = 3 m v = k —3. По табл. УП 
Приложения 2 находим, что с доверительной вероятностью 0,95 
квантиль 7? 0.05/у-5 = 11,1. Это меньше эмпирического y? = 9,88, 
следовательно, отличия эмпирического распределения от нормаль- 
ного можно считать случайными; аппроксимация удовлетвори- 
тельна. 

Сравнивать две или более эмпирических совокупности обычно 
требуется для того, чтобы установить, являются ли они выборками 


* Считается, что формула (5.2.3а) предпочтительней, чем (5.2.36), так 
как последняя требует большей точности промежуточных вычислений. 
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И и 


из одной и той же генеральной совокупности, и можно ли их объеди- 
нить, чтобы получить выборку большего объема. Пусть имеется $ 
эмпирических распределений, полученных в несколько различных 
условиях (например, разными TORN) — и e общем случае) 
имеющих неодинаковые объемы п; (j = 1, 2, ‚ 5). Если это слу- 
чайные выборки из одной совокупности, то логично предполагать, 
что их частости р;; в каждом İ-TOM интервале случайным образом 
рассеиваются вокруг теоретической вероятности pi. того интер- 


вала группировки. Тогда ожидаемую частость р? выборки суммар- 
S 


ного объема У п; разумно определить. как взвешенное среднее. 
1-1 
арифметическое частостей р; Не выборок: 


$ 


У три 
р: (5.2.4} 


S 
2# 
- ]=1 
Для получения расчетной формулы % критерия в случае срав- 
нения произвольного числа 5 выборок неравных объемов п, BOC- 
пользуемся свойством х?-распределения, согласно которому сумма 
из $ независимых слагаемых, имеющих 7/-распределение с V; 


‚ степенями свободы, также имеет у?-распределение с числом степе- 
$ 
ней свободы 3 у;. Тогда 
1=1 | 
k 


| гум S pum -Yn bs a са: N 


j=1 . |i=1 
где k — равное для проверяемых (объединяемых) выборок число 
- интервалов группировки; р; — определено выше уравнением 
(5.2.4), Pi; — частости Гтого интервала ]-того эмпирического pac- 
k 2, 


пределения. Так как > может быть больше либо меньше 


ist ; 
единицы, берется абсолютное отклонение этой суммы от единицы. 


Число степеней свободы V, необходимое в этом случае для определе- 
ния квантиля Yå y из табл. УП Приложения 2, находят следу- 
ющим образом. Каждое из слагаемых )? определяют, исходя из 
у = k — 1 степеней свободы (одна степень «связывается» на HYNE- 
вой начальный момент). Но суммируют $ слагаемых, и на эту. 
сумму тоже «связывается» одна степень свободы, так что всего. 
получается степеней ое 


-У@-0=6-0@-1. x (5.2.6) 


j=1 
Пример 5.2.2. В примере 2.3.2. были рассмотрены три способа 
группировки, различающиеся принципом размещения «граничных» 
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значений вариант по интервалам. Требуется оценить, будут ли 
однородными эмпирические распределения, получаемые такими 
разными способами. Исходные данные приведены в трех последних 
столбцах табл. 2.3.8. Соответственно обозначим вероятности: 
Р: (2; = Х < 1.) = Anr Р: (< Хы) = Ро и р, (1 = 
= X < ti) = Pig, объединим, суммируя частости, два верхних 
и три нижних интервала (чтобы выполнялось: fj; > 5), после чего 
результаты представим, как показано в табл. 5.2.2. 
e Таблица 5.2.2 


Вычисление y2 к примеру 5.2.2. 


Pj | Pij | 21) 21} : 23 
0,025 0,000625 6,25 : 275 =~ 0,0227 
0,045 0,002025 20,25 : 575 ~ 0,0352 
0,125 0,015625 | ит. д. 0.1250 

f 0,145 0,021025 0,1237 

Pil 0,290 - 0,084100 3058 
0,185 0,029425 ` 0,1658 
0,110 0,012100 0,1180 
0.075 — 0,005625 . 0,0865 
0,030 0,000900 9 : 275 == 0,0327 
0.070 0.004900 49 : 575 == 0.0852 
0,125 0,015625 ит. д. 0,4250 

0,195 ° 0,038025 0,2237 

Piz 0,260 0,067600 0,2458 
0,170; 0,028900 0,1628 
0,095 0,009025 0,0881 
0,055 0.003025 0,0466 
0,0275 а 8 2 
0,0575 У Pitti 0987 \ 2... 1.009 
0,1250 had Dis о’ lad Pig, ’ $ 
0,1700 i=1 i=1 

‘Pig т 12 = 200 ( | 0,9827 — 1 |+ | 4,0099—1|) = 4,72, 
0.1025 v= (2—1) (8—1) =7, 
0,0650 | X3, 05/v=7 7 141 по табл. УП Приложения 2. 

п=200 2 < 20,05/1 


Теоретическая вероятность (как частость объединенной вы- 
борки) определяется здесь, очевидно, как р; = (p, i + Pia + 


+ P; 3) :3 = р, з. При этом не к чему вычислять р? 3/P; z, а ` AS 


— 1. Следовательно, вычислительная формула ya naa Hamaro 
примера получается из формулы (5.2.5) путем несложных преоб- 


разований: 
2 
"| 
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Результаты вычислений и проверки гипотезы приведены 
в табл. 9.2.2. Можно видеть, что эмпирические распределения, 
полученные разными способами группировки, однородны. Сле- 
дует, однако, заметить, что данный вывод справедлив лишь при 

= 200. Нетрудно видеть, что уже при п >> 600 различие в спо- 
собах группировки, рассмотренное в $ 2.3, приведет к неоднород- 
ности получаемых эмпирических распределений, а это в конечном 
счете означает неадекватность аи описания генеральной 
совокупности. 

Оценка статистической однородности может выполняться для 
двух и более многомерных распределений частостей событий (вели- 
чин). Тем самым решается вопрос о возможности объединения соот- 
ветствующих выборок в одну большего объема. 

Пример 5.2.3. В примере 4.3.1 оценивалось распределение зна- 
чений социометрического статуса, эмоциональной экспансивности 
и нейротизма для выборки объемом п, = 42 у студентов одного 
из курсов психологического факультета (табл. 4.3.2). Для студен- 
тов другого курса получена новая выборка, объемом п. = 57, 
для которой распределение частостей приведено в табл. 5.2.3. 
Требуется проверить, однородны ли обе выборки в статистическом 


смысле, и если да, то объединить их. 
, Таблица 5.2.8 


Частости совместного распределения социометрического статуса: (X1), 
эмоциональной экепансивноети (Хз) и нейротизма (X2) второй выборки 
студентов (к примеру 5.2.3) 


Кат: ЕЕ Хо < 13,5 \ Х22 == Х› SS 13,5 
Хз = Хз< 0 Хз = Хз >20 Хз1 = Хз < 0 Хз = Хз >20 
zti = Ак. 0 р111=0 — рз=0,42 р121=0 .| P122 = 0,02 
112 = X1 = 0 P211 = 0,04 P212 = 0,52 P221 =0 P222 = 0,30 


Пользуясь формулой (5.2.4), вычислим ожидаемые значения 
частостей в объединенной выборке: 


Ра =y: (0,07-42--0,00.57) ==0,03, 


Pite = y (0.07.42 -0,12.57) ==0,10 


{ 
и т. д. — результаты приведены в табл. 5.2.4. Остальной расчет y? 
осуществим по формуле (5.2.5), как показано в табл. 5.2.4. Можно 
видеть, что различия частостей случайны, значит, обе выборки 
статистически однородны и допустимо объединение. Частости 
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z Таблица 5.2.4 


К вычиелению эмпирического X2 в примере 5.2.3 


Ph=4, 2|  Pijmk Рут ть "РЁ 

0.07 0.0049 0.163 
0.07 0.0049 0.049 _ 
0.10 0.0400 0.250 
0.02 0,0004 0.020 

Р1 0.07 0.0049 0.010 
0,34 0,1156 0,256 
0,07 0,0049 0,163 
0,26 0,0676 0,241 
0,00 0,0000 0.000 
0,12 0,0144 0,144 
0,00 0,0000 0,000 
0,02 0,0004 0,020 

P2 0,04 0,0016 0,032 
0,52 0,2704 0,601 
0,00 0,0000 0,000 
0,30 0,0900 0,321 
0,03 
004 > и = 1,152, 

p** Е $=1 7=1{ т=1 т 

А ра 
0,45 ~J p S 
0,03 SSY z -18 
0,28 р Рут 


$=17 
y2 ==42 (1,152—1) 51 (1,118—1) == 1311, 
у = (2—1) (8—1) =7, 
23.0512 = 44, > = 13,1, 
т. е. выборки однородны 


НЙ 
п = 99 


объединенной выборки приведены в табл. 5.2.5. Заметим, что это 
те же самые ожидаемые частости Pijm, что и в табл. Г 2.4. 
Оценка стохастической невависимости в системе случайных 
событий (величин) осуществляется путем сопоставления эмпири- 
ческой величины %?, образующей числитель в формулах (2.3.29) 
и (4.1.19) для коэффициента Чупрова, с табличным значением 
квантиля Xa, у. Причем число степеней свободы всегда определяется 
по уравнению (5.2.6) как v = (m — 1) (п — 1), где т — число 
строк таблицы совместного распределения частостей событий 
{величин), а п — число столбцов; для формулы (4.1.19): т = t 
ип == g. «Нулевая» гипотеза в этом случае формулируется, напри- 
мер, так: «величина коэффициента Чупрова случайно отличается 
от нуля (незначима)», т.е. стохастическая связь отсутствует, 
события (величины) независимы в стохастическом смысле. 
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_ Таблица 5.2.5 


Частости совместного распределения статуса. (p; 
эмоциональной экспанеивности (X) и нейротизма (X2) 
в объединенной выборке (п—99) 


Ха1 = Xs < 135 : Xss = Х. > 13,5 
; sa = ARLO sn ağa 20 | хн=х. < 0 | ве, 
т1=Х: <0 Р111 = 0,03 P112 = 0,10 р121 = 0,04 p122 = 0,02 


212 = Ху =0 p211 = 0,05 Р212 =0,45 |  рээл= 0,03 P222 = 0,28 


Пример 5.2.4. Проверим значимость коэффициента Чупрова, 
вычисленного в примерах 1.3.9 и 4.3.1. В первом из них оценива- 
лась сопряженность между цветом волос и глаз. Эмпирическое 
‚значение 7? = 106; при у = (3 — 1) (4 — 1) = 6 из табл. УП 
Приложения 2 находим: 7? 01/6 = 16,8, что значительно меньше 
эмпирического %?. Следовательно, искомая сопряженность несом- 
ненна, и А = 0,25 значимо отличается от нуля. 

_Во втором примере эмпирическое значение у? a~ 9,28. При 
числе степеней свободы .v = (2—1). (4 —1) =3 квантиль 
{0.01/3 = 14,3, а квантиль %Ход5/з = 7,82. Оказывается, что 
имеет место не предусмотренный нами до сих пор случай: 
X0,05/3 < X3 < %.01/у. Этот случай будет подробнее рассмотрен 
B $ 5.3, а здесь отметим, что в такой ситуации обоснованного 
решения принять нельзя: требуются дополнительные наблюде- 
ния. Можно, однако, предполагать, что при увеличении ‘числа 
наблюдений наличие стохастической связи статуса, эмо- 
циональной экспансивности и нейротизма будет статистически 
обосновано. Действительно, по результатам предшествующего 
примера для объединенной выборки (99 студентов) значение 5? — 
zæ 18,1. В силу свойства аддитивности х?-распределения, упомя- 
нутого выше, эта величина X” соответствует числителю коэффи- 
циента совместной детерминации (4.1.19), определябмого для COB- 
местного распределения частостей объединенной выборки, предста- 
вленных в табл. 5.2.5. Так как y? = 13,1 > № о1/з = 11,3, можно 
считать, что статус, экспансия и нейротизм стохастически зависимы. 
Определяя заново по (4.1.19) коэффициент совместной детермина- 
ции, получаем достоверно отличные от нуля значения: Kh ~ 0,0765 
и Ky œ 0,28. 

Оценка эмпирической последовательности совы как бернул- 
лиевской или марковской цепи (простой или сложной) может 
состоять в проверке однородности матриц переходных частостей, 
вычисленных для разных начал отсчета перехода, либо (для Mpo- 
верки «простоты» цепи Маркова) в сопоставлении $ эмпирических 
матриц последовательных переходов А.,..., A; с матрицами Аз = 
= АЗ, Аз = A}; . . .; Аз! = АЗ, вычисленными в предположении, 
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что аппроксимирующая цепь Маркова — простая. При такой 
проверке эмпирическое значение Y? вычисляется по формуле 
(5.2.5), а число степеней свободы для квантиля Xa, y определяется 
по формуле (5.2.6), где k — порядок матриц перехода. Так, mpo- 
цесс запоминания группы слов в эксперименте по свободному BOC- 
произведению, рассмотренный в примере 1.3.11, действительно 
является простым марковским, так как для него y? = 0,6, T.e. 
значительно меньше любого критического YY, 05/у. 
Проверка однородности парных корреляций может осуще- 
ствляться для диагональных элементов корреляционной матрицы 
с целью установить, стационарна или нет случайная функция, либо 
для нескольких корреляционных матриц с целью установить их 
однородность. Поскольку корреляционную матрицу можно рас- 
сматривать как объединение векторов коэффициентов корреляции 
(строк или диагоналей), то начнем с более общего случая проверки 
однородности корреляционных матриц. 

Пусть требуется проверить однородность $ корреляционных 
матриц порядка М. Для каждого из 0,5М (N— 1) р коэф- 
фициентов и Tijk ($ = 41-59. у, ДЕ 
Boit jk =1,2,..., $) потабл. III Приложения 2 определяется 
соответствующее 2, ;,- преобразование по Фишеру. Тогда для каж- 
дого коэффициента корреляции г;, имеем в сопоставляемых матри- 
nax [ный вектор из $ 2/;р- преобразований, распределенных асим- 
птотически нормально, с общим средним арифметическим 21 
и дисперсией. ошибки ' 


< 


Вит, (5.2.7) 


где п, — объем выборки, из которой определены коэффициенты . 
корреляции /-той матрицы. Как и прежде, будем считать, что ожи- 
даемое среднее арифметическое значение дл для [-ного вектора 
есть среднее взвешенное: 


S 
У (ne —3) Zijk | 


k=1 
S 3 . 
; n 53 
zt = 2 ("+ —3) (5.2.8) 
$ 
-- У, при N, =N, = =n 
. 5) ijk p S Rate SE a E A ke 


L k=1 


Для s матриц порядка N всего имеется L = 0,5N (N — 1) 
различных 1-ных векторов (l = 1,2, ..., L), которые надо cono- 
ставлять. В этой связи эмпирическое значение`)? может быть NONY- 
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чено как сумма по L и $ взвешенных частотой (Ng — 3) ВОО 
Е отклонений (2. — Ziji)”: 


Ds 
x? = È D (Te —3) (rja — i)? = 


2 
У (nk — 3) z| 


s5 У. ны ‚62% 
=1 


si У (nk —3) 
k=1 
\ 
где l = 1,2,..., L — номер вектора проверяемых на однородность 


коэффициентов корреляции. При одинаковых объемах выборок 
все п, = п, и формула (5.2.9) Ре 


Ук У 5 me = iea) 5 È DF 3 sn) | | 


l=1 №=1 [=1 [А=1 k=1' 
(5.2.40) 


Очевидно, что при сопоставлении матриц корреляций, как и для 
матриц вероятностей, число степеней свободы определяется фор- 
мулой (5.2.6), что в новых обозначениях дает v = (L — 1) ($ — 1). 


Таблица 5.2.6 
Проверка однородности двух корреляционных матриц 


РИА |5 оЙ ijk ба (zii) | (0—3) (ziji) 

e Taoa | —0,2342| 00308 0,00013864 0,00540696 

Первая 0,302 | 0,3095| 0,0853 0,00727609 0,28376751 

—0,238 | —0,2448| 0,0694 0,00481636 0,18783804 

—0,276 | —0,2877| 0,0227 0,00054529 0,02782566 

Вторая 0,162 | 0,1614| 0,0628 0,00394384 0,21296736 

—0,347 | —0,3654| 0,0512 0,00262444 0,14155776 

ыы —0.259 | —0,2650 SRS 
_ Объеди- 0,220 | 0,2242| 2%: ===: (0,2342 - 42 4+0,2877 57) =0,2650, 
ненная | —0,304 | —0,3442| 17 (99 
ие oT . (0,3095 + 42+ 0,1614 -57) = 0,2242, 
п1=42, m=51, 

n=99, | 2433 = y . (0,2448 - 424+ 0,3654 - 57) = 0,3442, 


2 3 

2=У У (ne —3) (ни — 2) = 085936329 ~ 0,86. 

1=1 В=1 
v= (2—1) (3—1) =2. Xp 05/2 =5,99 > Х2= 0,86, т. e. выборки однородны. 


303 


Сопоставление $ коэффициентов . корреляции «внутри» [-ного 
вектора, очевидно, должно СОНИН по тем же формулам 


(5.2.9 или 5.2.10), если положить в них > 1. Соответственно 
Ге | 


число степеней свободы будет v = $ — 1. 
Пример 5.2.5. В табл. 4.3.5, г sen 249) представлены коэф- 
фициенты линейной корреляции между социометрическим статусом 
(Х!), эмоциональной экспансивностью (Х.) и нейротизмом (Х,), 
полученные на второй выборке студентов (п. = 57). Проверить 
однородность этих корреляций с полученными на первой выборке 
(табл. 4.3.5, 6). 

В данном случае $ = 2 и L = 3. Определив по табл. II При- 
ложения 2 необходимые Z, - преобразования, произведем вычисле- 
ния по формуле (5.2.9). Все необходимые промежуточные и окон- 
чательные результаты представлены в табл. 5.2.6. Так как выборки 
однородны, корреляционную матрицу объединенной выборки объ- 
емом 99 человек получаем, выполнив по табл. [У Приложения 2 
обратное преобразование средних Zijl в коэффициенты корреля- 


Таблица 5.2.7 


Проверка однородности вектора коэффициентов корреляции 
(к примеру 5.2.6) 


Ei. Zijk 24—28) (21—23) 
0,16 0,1614 0,2204 0,04857616. 
0,42 0,4477 0,0659 000434281 
0,46 0.4973 - 0,1155 001334025 
0,18 0,1820 0,1998 0,03992004 
0,47 0,5101 0,1283 0,01646089 
0,51 0,5627 -{=-9.4809 0,03272481 
0,63 i 0,7414 0,3596 0,12931216 
— 0,20 —0,2027 — 0,5845 0,34164025 
0,58 0,6625 0,2807 007879249 
0,25 0,2554. 0,1264 0,01597696 
г: —=0,36 | 2*,=0,3818 Сумма: 0,72408682, 
| y2 =20. 0,72108682 == 14,4, 
n = 23, y = 9, 
18,05 /э = 16,9 >> %2 = 14 4, T. е. можно принять гипотезу 0б однород- 
ности Tij- | 
ции T;j (они представлены в табл. 5.2.6): Газ = —0,259; г. . = 0,220; 
Гоз = — S] 


Пример 5. 2.6. B примере 4.4.1 рассматривалась нормирован- 
ная автокорреляционная функция случайной ошибки слежения. 
Чтобы установить, стационарна ли ошибка слежения как случай- 
ный процесс, надо проверить, зависят ли значения нормированной 
автокорреляционной функции от начала отсчета сдвига т. Если 
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они не зависят от начала отсчета, TO 7;j, лежащие Ha /-ной диагонали 

корреляционной матрицы (табл. 4.4.95), должны быть однородны. 

Проверим однородность коэффициентов гу; лежащих на первой 

диагонали (считая вверх и вправо от главной диагонали) табл. 4.4.5. 

Так как число наблюдений п одинаково для всех $ = 10 koag- 

фициентов Tjj, то вычисление %* произведем по формуле (5.2.10), 
ЕР 


полагая = 1, как показано в табл. 5.2.7. Можно видеть, что 
[21 

при данном числе наблюдений (п = 23) нет оснований отклонять 

гипотезу об однородности Tjj, вычисленных при одинаковых сдви- 


гах т, но разных началах отсчета т. Следовательно, можно усред- 


нять коэффициенты, вычисляя Ву, как и сделано в табл. 4.4.5. 

Мы рассмотрели основные аспекты применения 5?-критерия 
к экспериментальным данным: Но он используется и для формиро- 
вания многих параметрических критериев, которые и рассмотрим 
ниже. 


5.2.3. Оеновные параметрические критерии 


-критерий Стьюдента 


Если Х — нормально распределенная случайная величина 
с нулевым средним и дисперсией, равной единице, а независимая 
от нее случайная величина XY? имеет у?-распределение с у степе-_ 
_нями свободы, то случайная величина 


- (5.2.10а}. 
KE 


имеет {- распределение Стьюдента с V степенями свободы. Плотность 
этого распределения (рис. 5.2.4) зависит только от V, имеет CHM- 
метричную форму и при’ увеличении V асимптотически стремится 
к нормальному распределению. 

Квантили № y распределения Стьюдента приведены для O = 
= 0,05, 0,01 и 0,001 в табл. VIII Приложения 2. Они используются 
для интервального оценивания и для проверки гипотез о случай- 
ности различия (сходства) любых параметров. 

При интервальном оценивании квантиль Íg y показывает, как 
указывалось выше (уравнение 0.1.5), на сколько стандартных 
погретнностей о (9) может отклоняться в меньшую и ббльшую. 
стороны выборочная оценка Ô от значения параметра 0* в генераль- 
ной совокупности. При интервальном оценивании любого из пара- 
метров 0*, согласно классификации на рис. 5:1: 1, поступают сле- 
дующим образом. 
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У: а выборочной оценке. 9 и табл. 5.1.2 вычисляют оценку стан- 

_ дартной погрешности о (0). Е эмпирическое значение 

{-критерия: и: 9 
0 


P= 0 ) (5.2.11) 


и по о табл. VIII Приложения 2 находят для У = п — 1 (а при yka- 
занных в Табл. 5.1.2 п — 2 или п — 3), ближайшее к £ снизу 
и ьскоа значение квантиля t& y, которое и принимается 
для указания границ доверительного интервала (с доверительной 


вероятностью 1 — а): 
В 50. (5.2.12) 


Рис. 5.24. =: Нлотность t- 
распределения Стьюдента. 
По оси ординат — плотность; по’ 
оси абсцисс — значения t; 1 — 
` upa v = 1, 2 — при v = 5, 8 — 

я при \ = ©. 


Важной разновидностью интервального оценивания является 
построение доверительной зоны (области) простой линейной ре- 
грессии и* = а,/.2 + аи. Существо дела здесь состоит в следу- 
_ ющем. Определяются доверительные значения среднего арифмети- 


‚ческого М (м): 
Umin = M (u) = ta,» +0 [М (u)], 
Umax = M (u) + ta ›- 0 [M (u)], 


а также доверительные значения углового коэффициента: 


Amin — @и/2 — la, "О (@и/:), 
тах ~ @и/2 A la, у ° O (@и/»), 


где стандартные ошибки определены формулами B табл. 5.1.2. 
Далее, как показано на рис. 5.2.5, через точки с координатами 
(Umax; М [Z] и (ина ; М [Z] проводят по две прямые, одну под 
углом Q4 к оси абсцисс, а другую — под углом 9, так, чтобы 
29, = anin M tZ A = арх. соответственно. В результате область, 
ограниченная заштрихованной на рис. 5.1.2 частью плоскости, 
и является доверительной зоной линии регрессии, в которой с ве- 
роятностью 1 — a заключена регрессия, соответствующая гене- 
ральной совокупности. 

При проверке гипотез о случайности (неслучайности) сходства 
{различия), в сущности, используют оценку вероятности совмест- 
ного перекрытия (или неперекрытия) доверительных интервалов. 
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Пусть 0} и0, — две выборочные оценки некоторого параметра 0*. 
Тогда эмпирическое значение {-критерия вычисляется по формуле: 


(5.2.11), в которой 0 =| 0, —60.| — 


к f 
Pe 5.2.13 
К (64 | (ое ) 
где о (10, —0.|) — стандартная погрешность разности выбороч- 
ных оценок определяется по формулам из таблицы 5.1.2. Далее 
по числу степеней свободы V = 4 
=п= 1 (annu n — 2; n — 3) из 
табл. УПТ Приложения 2 опреде- 730 
ляется квантиль Íg y, для KOTO- 


poro либо t? < Б/у и тогда при- fe 
нимается проверяемая «нулевая» 90 
гипотеза, либо Г >> Цо1/у и тогда 

принимается альтернативная гипо- 70 
теза. В случае Ну CLP S 50 


< № ,01/» Принимается решение 
увеличить число наблюдений. 30 

Специальным случаем проверки o 
гипотез с помощью 1-критерия «к 


является оценка значимости не- - 10 
которого параметра, т. е. оценка WS 
достоверности отличия величины AAN 
параметра от нуля. Такая поста- - 50 
новка вопроса применяется к Me- -30 


рам асимметрии и эксцесса, к мерам 2 
детерминации и связи. При этом Punc. 5.2.5. Доверительная область 
используется формула (5.2.11), (заштрихована) линии регрессии 
а гипотеза проверяется так же, ея те 0,999) пре меру 

о оси абсцисс — статус в своей груп- 
как и. при’ оценке 6хбдства, (или: ‘це. (и); по. oen обоват Стас KA 
различия). Заметим, что проверка  КУрсе (у) в %; 1—при [М (У] р и 
значимости коэффициентов корре- “и/хшие; 2 — при [М (Ylmin и 


ато ‚ 8 — при [М (У) ‚и 
ляции и регрессии составляет су- и 4 — при [M (pax 
Jmin’ m 

щество классического корреляци- и [ау/х] пах: gi 


онного и регрессивного анализа. 
Пример 5.2.7. Определить доверительный интервал для веро- 
ятности записывания цифры «7» испытуемым (пример 1.1.2), если 
число наблюдений n = 1300, а частость р («7») = 0,108. По. 
табл. 5.1.2 находим формулу для о (р): | 


o(p) = РРР —]/ 9168-0882 0,00861. 


Но формуле (5.2.11) определяем: 


t° — 0,108 : 0,00861 ~ 12,5. 
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` Из табл. VIII Приложения 2 можно видеть, что при V = со 
001/у = 2,58 <t. Следовательно, по формуле (5.2.12) можем 
определить интервал: 


0,108 — 2,58.0,00864 = р («7») = 0,108 + 2,58 - 0,00861 
или 0,086 < р («7») = 0,130, _ 


в котором с доверительной вероятностью 0,99 заключена вероят- 
ность появления цифры «7» в я цифр, записыва- 
емых данным испытуемым. 

Пример 5.2.8. В примере 3.3.3 для 42 студентов были опреде- 
‚ лены линейная регрессия социометрического статуса на р 
се (y) в зависимости от статуса в своей группе (x) : у = 
— 2x + 18, а также безусловные средние арифметические М A 


= 95, M [X] = 3,34; стандартные отклонения o [У] = 28,8 


и о [ХЕ = 954; коэффициенты линейной корреляции Try = 580 63 
_и нелинейной детерминации NJ = 0,33 и у = 0,477. Требуется 

проверить, удовлетворительна ли линейная аппроксимация ре- 
грессии «у по L», и, определив доверительные интервалы для М [У] 
и @у/х, установить доверительную область теоретической регрессии 


социометрического статуса на курсе в зависимости от статуса 


в своей группе. 

Проверка удовлетворительности аппроксимации сводится к про- 
верке значимости различий между наибольшим из коэффициентов 
нелинейной детерминации и квадратом Кооффидионта т линейной 
корреляции: 


Их/у ых т Е 0,477 НР 0,397 = 0,08. 


По табл. 5.1.2 находим, что в зависимости от числа условных сред- 
них M (x/y), из которых вычислялся коэффициент дотерминации 
Чх/у (их было Г), стандартная погрешность 


с (MEy — r3) =У0,08:5 270748: 
По (5.2.11) вычисляем эмпирическое значение {-критерия: 
в = (лу — r3y) : 0 (у — 7) ~ 0,6, 


что меньше любого наименьшего теоретического квантиля tq, vy. 
Следовательно, гипотеза о линейности не отвергается (различия 
случайны). 

Определим далее доверительные интервалы для М (У) и ayjx 
и вычислим их минимальные и максимальные значения. Формулы 
стандартных погрешностей находим в табл. 5.1.2: 


o [М (У) =с (Y) : ИУп=28,8 : И 42 ==4,4, 


И 288 ИЯ — 
ОИ ТИ 0966. 
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Тогда для v = 40 иа = 0,001 из табл. VIII Приложения 2 опре- 
деляем ta, v = 3,99 и по уравнениям (5.2.14 и 15) находим: 


[М (Y)lmin = 9,4, [М (У)шах = 40,6; 
[@у/х] па = 0,7, lelain Gö 


Чтобы построить доверительную область регрессии, нужно 
через точки с координатами (9,4; 3,34) и (40,6; 3,34) провести пря- 
мые с минимальными и максимальными угловыми коэффициентами. 
Проще всего поступить следующим образом. Найдем дополнитель-‘ 
ные точки, через которые пройдут искомые границы доверитель- 
ной зоны. Так как tga = Ду: Az = ах», то Ау = Ах - ау. 
Выберем координату по Z для искомых точек: д = 30; тогда Ах = 
= 30 — М (X) = 26,66 и, следовательно, координаты по у будут: 


У = [М (У). + Аул = 9,4 + 26,66 [@у/хпиа = 28,1, 
Ya = [М (Уши + Аунах = 9,4 + 26,66 [ау/=]шах = 88, 
уз = [М (У) мах = AYmin = 40,6 + 26,66 [ay /x]min = 59,3, 
ya = [М (Y)]max + A Ymax = 40,6 -+ 26,66 [@и/х] шах = 128,6. 


Через найденные точки с координатами (Y1; 2), (Ya; <), (Yz; 2) 
и (Y4; 2) и точки «центров рассеивания» проводятся, как показано 
на рис. 5.2.5, «граничные» прямые. Ограниченная ими область 
(на рис. 5.2.5 заштрихована) и есть зона, в которой с доверитель- 
ной вероятностью 1 — a = 0,999 располагается теоретическая 
регрессия. Заметим, что мы построили максимально широкую 
область. Ограничиваясь меньшей доверительной вероятностью, 
можно существенно сузить и доверительную зону регрессии. 
Но выбор доверительной вероятности — это не статистическая 
задача. | - 

Пример 5.2.9. Осуществим элементарный анализ коэффи- 
циентов корреляции статуса на курсе (X), нейротизма (Х,) 
и эмоциональной экспансивности (X $) в первой выборке объемом 
42 человека и в объединенной выборке объемом 99 человек (см. 
пример 5.2.5). Будем считать коэффициент корреляции 7,, зна- 
чимо отличным от нуля, если для его 2,,-преобразования справед- 
JABO, что 

= | zy | : 0 (211) > to,01/n-1° 


Тогда, используя табл. 5.2.6, где приведены Z;; преобразования 
для рассматриваемых коэффициентов, вычисляем: 


o (z) =1:И 42 — 3 ~ 0,16 —для всех 2, 
#=|215|: 0,16 = 0,2342 : 0,16 ~ 1,46 < to,01/40 = 2,70 — незначимо, 
t —|23|: 0,16 = 0,3095 : 0,16 ~ 1,93 — незначимо, 
t — | Zas | : 0,16 =0,2448: 0,16 ~ 1,53 — незначимо. 
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Но ТЯ объединенной выборки оказывается: 
| o (211) =1: И 99 —3-=0,4 — для всех Zij, 
tt [1 0,122.65 —> A = 2,63 — значимо, 
t = | zï; | : 0,1 ~ 2,24 — сомнительно, 
t= | 22з|:0,1 ~ 3,14 — значимо. 


Можно видеть, что увеличение объема выборки приводит 
к тому, что статистически незначимые оценки превращаются 
в статистически значимые. Разумеется, это можно установить, 
лишь проводя дополнительные наблюдения. Таким образом, ста- 
тистическая незначимость оценок при малом объеме выборок еще 
ни о чем не свидетельствует, кроме того, что необходимы дополни- 
тельные испытания. ^ | 

Чтобы избежать значительных вычислений при проверке зна- 
чимости коэффициентов в корреляционных матрицах высокого 
порядка, можно по квантилям {-распределения и 2-преобразованию 
(прямому и обратному) заранее вычислить критические значения 
Го. п, © КоТорыми сопоставляются эмпирические коэффициенты KOP- 
реляции г,; с целью проверки их значимости. Такие критические 
значения r n для а =-0,05 и 0,01 и для 4 = в=< 100 приведены 
в табл. У Приложения. 2. Аналогично критические значения ра, n 
коэффициента ранговой корреляции Спирмена представлены для 
5 = п <40 в табл. УТ Приложения 2. 

На использовании {-критерия Стьюдента основывается метод 
расчленения корреляционного графа на части, отличающиеся по 
степени тесноты корреляций. Такие части, как упоминалось выше, 
называются корреляционными плеядами. Следовательно, корре- 
ляционная плеяда — это некоторая часть исходного корреляцион- 
ного графа (или, соответственно, — корреляционной матрицы), 
полученная удалением некоторых дуг и вершин. 

Имеются два взгляда на содержательную интерпретацию корре- 
ляционных плеяд и несколько формальных методов их выделения 
из корреляционного графа. Согласно первому взгляду, корреля- 
ционная плеяда есть «пучок» переменных, относительно тесно 
коррелирующих друг с другом. Одна (или более) из переменных 
в пучке имеет наибольшее число тесных связей с остальными пере- 
менными и рассматривается как индикатор, обусловливающий 
связи внутри пучка.* Согласно второму взгляду, корреляционная 
плеяда — тоже «пучок» относительно тесно коррелированных 
переменных. Но причина этих корреляций находится вне данной 
системы переменных — это некоторая латентная переменная, 
влияние которой и проявляется в корреляциях преимущественно 


* П. В. Терентьев. Метод корреляционных плеяд. Вестник ЛГУ, 
1959, № 9. 
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Рис. 5.2.6. Выделение корреляционных плеяд методом расслоения. ~ 
r (Е) — секущие плоскости (границы слоев); | Ат; | —«шаг» расслоения; О 


минимальное значение коэффициента корреляции, достоверно отличающееся от 
нуля. 


данного пучка.* Оба взгляда основываются на интерпретации 
факта парной корреляции либо как взаимодействия между самими 
коррелирующими переменными, либо как следствия их взаимодей- 


* П. В. Терентьев. Дальнейшее развитие метода корреляцион- 
ных плеяд. В c6.: Применение математических методов в биологии. Л., 1960; 
9. М. Браверман. Методы экстремальной группировки параметров и 
задача выделения существенных факторов. «Автоматика и телемеханика». 
M., 1970, №1; B.A. Л умельский. Группировка параметров на основе 
квадратной матрицы связей. Там же. 
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ствия с некоторой неконтролируемой переменной (стр. 229). 
Нетрудно видеть, что эти взгляды не противоречат, а дополняют 
друг друга. 

Из формальных методов выделения корреляционных плеяд 
наиболее распространены методы расслоения (срезов) и методы 
факторного анализа. здесь мы рассмотрим методы pac- 
слоения. | 

Существо методов расслоения состоит в следующем. Величины 
коэффициентов парной корреляции т;, можно изобразить, как 
показано. на рис. 5.2.6, в виде перпендикуляров длиной г;, к плос- 
кости коррелируемых перемен- 
ных ХОХ,. Проводя секущие 
плоскости через Дг;;, начиная 
от некоторой достоверно OTIM- 
чающейся от нуля величины 
Tmin» Можно расслоить «тело» 
корреляций на $ частей, корре- 
ляции «внутри» которых и 06- 
разуются $ плеяд. Так, для се- 
чений, показанных в общем 
виде на рис. 9.2.6, выделяются 
шесть плеяд, которые в обыч- 
ной форме корреляционных 
подграфов изображены на ри- 
сунке 5.2.7. 

. Вместо расслоения можно 
_ Проводить отслаивание плеяд, 

Рис. 5.2.7. Корреляционные плеяды 
аа а авиа последовательно отсекая часть 
1 при» >r (2); П- приз (1) <т/<г(2); СВЯЗеЙ с 2 согласно нера- 
пт—при fmin <r <r); ТУ-при венству |r; | < [Г (k)|, так что 
—Tmin 27у>-—т(4); У-—при-—г(1)> остаются лишь переменные, все 
=> 2); УЕ при г) = ту. более и более тесно связанные, _ 
| либо, наоборот, согласно нера- 
венству: |r;;| > [г (Ё)|, так что остаются переменные, все менее 
и менее тесно связанные. Заметим, что если расслоение рассмат- 
ривать как аналог дифференциальной функции распределения, 

то отслаивание аналогично интегральной функции. 

Существенным для техники выделения плеяд расслоением 
(или отслаиванием) является, во-первых, выбор начала отсчета 
min» а Во-вторых, определение «шага» | Ar;;|. Очевидно, что нет 
смысла выделять статистически недостоверные плеяды. Следова- 
тельно, во-первых, выделять плеяды можно лишь из числа Tjj, 
значимо отличных от нуля, и, во-вторых, коэффициенты «соседних» 
плеяд должны неслучайным образом отличаться друг от друга. 
Поэтому началом отсчета плеяд должно быть критическое зна- 
чение To, n, как оно определено выше (гии == Го, п), а «шаг» 


расслоения -| Ar;; |, очевидно, следует определять по уравнению 
(5.2.13). | 
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Используя прямое (2) и обратное (z7!) преобразования Фишера, 
можем определить для заданного объема выборки (п): 


[Tmin [= Za» |t, где 
[2a | =: Ип— 3; (5.2.14) 
y =n — 1; а=0,01, | 
| Аг| =| 42| 1, где | | 
т (5:2.45) 
iseler о 
после чего границы слоев определяются формулами 
г (1) =гиы Аг и r(i+ 1) =гО-А,г. (5.2.16) 


Очевидно, для фиксированного N можно статистически досто- 
верно выделить лишь $ корреляционных плеяд: 


os: Aem 
s=ant{ Emal 4, (5.2.17) 
где ant {...} — знак округления до целого. Для удобства 


практического использования по формулам (5.2.14) —(5.2.17) вы- 
числены для ряда п значения Tmin» | Ar | иг (i) при доверительной 
вероятности 1 — а = 0,99; они приведены в табл. XI Приложе- 
ния 2. Е 

Пример 5.2.10. В табл. 5.2.8. представлены интеркорреляции 
одиннадцати переменных, тестируемых по методике Векслера. 
Эти данные получены усреднением (через 2-преобразование) 
восьми статистически однородных выработок по сто человек в воз- 
расте от 18 до 25 лет, так что объем объединенной выборки (п = 
= 800) позволяет достоверно выделить пять корреляционных 
плеяд. 

Перед расслоением корреляционную матрицу целесообразно 
ранжировать. Для этого через 2-преобразование в исходной матрице _ 
вычисляются средние значения коэффициентов корреляции каж- 
дой переменной со всеми остальными (десятью): 


M [r] = (М [z;)) *, 


где | 
| -Ni : 
M [z;;] =», Ziji ; (5.2.18) 
11 
N — порядок корреляционной матрицы; (...)'! — символ об- 


ратного 2-преобразования. Эти М [г,;| показывают степень связи 
остальных V — 1 переменных с 1{-той. Переставляя одноименные 
столбцы и строки исходной корреляционной матрицы в соответ- 
ствии с убыванием рангов по М [r;;l, получаем ранжированную 
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Исходноя корреляционная матрица к примеру 5.2.10 | Габлица 5. 2.8 


0,454 т 
0,363 4 
0,336 7 
0.44 3 
0,254 |1 
0.430 |2 
9 
5 
6 
8 


0,310 
0,363 

0,345 

0,310 g 
0,300 | 10 


4 


Обозначения: 1-—общая осведомленность, 2 —понятливость, 3— внимательность, 4— способность K 0606- 
щению, 5 — непосредственное запоминание (на цифрах), 6 — уровень овладения родным языком, 7 —скорость овладения 
сенсомоторным навыком (кодирование символами), 8 — наблюдательность, 9 —комбинаторная способность (к анализу 
и синтезу), 10 — способность к организации частей в осмысленное целое, 14 — способность к эвристическому синтезу. 


_ М [ГИ] — среднее значение коэффициента корреляции {-той переменной с остальными (]-тыми)}переменными. Подчер- 


кивания соответствуют элементам корреляционных плеяд, представленных на рис. 5.2.8 и 5.2.9, 


GPE 


Ранжиреванная корреляционная матрица * Таблица 5.2.3 


0,647 0,623) 0537 0,485) 0,371 0,438 0,363 _ 0,371 } ) 0,336 0,282 


м -en 


1 0,572 0,508 | 0,405 7 0,336 \ \. 0, 405 0,345 0.345 0,282 ! "0, 354 j 
[ 
| 


ый 


[о 0,551 io 0,422 \ 0,310 0,345 0,318 0,318 0,291 0,273 
— 0,485 0,377 0,310 0,273 0273 0,273 0,291 
0,318 Г 0,383 \ 0,310 10,388 \ | 0, 216 
0,345 | 0,388 0.388 
1 N о о 
| 4 0254 0336 :0.207 ; 
1 0245 0254. 


корреляционную матрицу (табл. 5.2.9), в которой корреляции 
преимущественно убывают слева направо и сверху вниз. — 

~ Ilo табл. ХТ Приложения 2 для п = 800 находим значения 
min И границ г (i) (см. подпись к рис. 5.2.8), после чего рассла- 
иваем ранжированную корреляционную матрицу (табл. 5.2.9), 


Рис. 5.2.8. Корреляционные плеяды, полученные расслоением матрицы 

| интеркорреляций (табл. 5.2.9). Ls 
Плеяда I — при 0,607 < т, образована переменными с теснотой связей выше средней} 
плеяда II — при 0,478 < Tip < 0,607 соответствует переменным со средней теснотой 
связей; плеяда ПТ — при 0,349 < Tij < 0,478 объединяет переменные с теснотой связей 
ниже средней; плеяда ТУ — при 0,220 < Ti < 0,349 соответствует слабо связанным пе- 
ременным; плеяда У — при 0,091 < т < 0,220 объединяет весьма слабо, хотя и зна- 

YAMO, связанные переменные. 


выделяя корреляционные плеяды внутри слоев (рис. 5.2.8), либо 
отслаиваем части корреляционной матрицы, ‘выделяя объединения 
корреляционных плеяд для вышележащих слоев (рис. 5.2.9). 

Содержательный анализ полученных плеяд выходит за пределы 
математической статистики. Но можно отметить два формальных 
показателя, способствующих содержательной интерпретации 
плеяд, согласно первому из двух взглядов, рассмотренных выше. 
Одним существенным формальным показателем служит степень 
вершины, т. е. число ребер, примыкающих к вершине. Перемен- 
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ная C наибольшим числом ребер выступает в качестве «ядра» 
плеяды и может рассматриваться как индикатор остальных пере- 
менных (данной плеяды). Например, на puc. 5.2.8 в плеяде I ин- 
дикатором служит переменная 1, для плеяды П — переменная 2, 
для плеяды ПТ — переменная 9. В плеяде IV четко выделяются 
два групповых «ядра»: одно из переменных 7,14, 10, а второе и 

переменных 3, 95, 4, причем 

«межъядерных» ребер больше, чем 

«внутриядерных», поэтому данную 

плеяду нельзя рассматривать как 
объединение двух разных плеяд — 

это целостное образование. Дру- 
гим существенным формальным. 
показателем служит теснота свя- 

зей. Переменная может иметь 
меньше связей, но более тесных в 

одной плеяде и больше связей, но 
менее тесных в другой плеяде (на- 

пример, переменная 4 в плеядах 

Пи ИГ на рис. 5.2.8). 


Е-критерий Фишера 


_ Если две случайные величины 
Y? и 92 имеют у2-распределения 
с числом степеней свободы у, M Va 


соответственно, причем ВвыпПолЛ- 
няется | неравенство 
2. 2. | 
Я Ng (5.2.19) Рис. 5.2.9: Корреляционные 
ся плеяды, полученные отслаива- 
то отношение нием. 
Плеяда I — при Ti; > 0,607; плеяда 
y3 y <- II — ups Tij > 0,478; плеяда ПТ — при 
F =A (5.2.207 ri; > 0,349; плеяды IV m V` не приве- 
Хз * 1 дены из-за большого числа связей. 


зависит только от числа степеней 
свободы V4 и Va иимеет Р-распре- 
деление с плотностью, показанной 
на рис. 5.2.10. | 


Обозначения те же, что на рис. 5.2.8. 
Можно видеть, что плеяды, получен- 
ные отслаиванием, являют собой объе- 
динения соответствующих плеяд, по- 
лученных расслоением. 


Квантили Fo/vı, у, рассматриваются как критические зна- 
чения отношений величин вида (5.2.20) и служат для проверки 
статистических гипотез о сходстве (различии) двух дисперсий, 
о значимости коэффициентов детерминации, 0б однородности 
ряда средних арифметических значений. Для a = 0,05; 0,01 и 
чисел степеней свободы Vy — для числителя формулы (5.2.20) 
и Vy — для ее знаменателя, доверительные значения квантилей 
Е-распределения представлены в табл. IX Приложения 2. 
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> у се A >— а. a Г. 
A > s A 


Сравнение двух ‘выборочных дисперсий осуществляется сле- 
дующим образом. Вычисляют эмпирическое дисперсионное от- 
ношение (Fa): Е 
| D o га 

D при v=% =n- 1, 
> Dı(na—1) apan Æ n, vı =n;— 1 $ ħa —1 
D2 (nı— 1) p 1 2, бей. 2 2 ? 

| (5.2.21) 


где всегда выбирается D, > D, n п, — объем выборки с ПБ, 
а n, — объем выборки с D.. Далее из табл. IX Приложения 2 
выбирают квантиль Рау, v, И проверяют условие: Fa S Fo,05/v1. ve — 
дисперсии отличаются лишь случайным образом, или F, > 
И ‚01/у:, ve — Отличия He- 
случайны. 

Значимость коэффициен- 
тов детерминации типа "2/2, 
NË 23..N ИЛИ Ги: M В? 23...М№ 
можно проверять по {кри- 
терию Стьюдента, рассмот- 
ренному выше. Но так как 


`08 


0,4 


0 они, в сущности, представ- 
Рис. 5.2.10. Плотность Р-распределе- "AIOT собой дисперсионные 
Е ния. отношения, то считается луч- 

По оси ординат — плотность, по оси абсцисс — им проверять их значи- 


значения F. 1 — при vı = V = 6; 2— при 
м = 42 из, = 6; 3 — прил биз, —,60.  MOGTE ПО Р-критерию. Для 


любого из коэффициентов 
детерминации эмпирическое значение Е-критерия находят сле- 
дующим oGpaaom; 


2 (mn — т) 
где n? — любой из перечисленных выше нелинейных (линей- 
ных), простых (множественных) коэффициентов детерминации, 
т — число переменных, исходя из которого вычислялся коэффи- 
циент детерминации 1?; п — число значений каждой переменной 
(одинаковое для всех переменных); тп — общее число всех наблю- 
дений.* 

Если вспомнить, что коэффициент нелинейной детерминации 
Nu/z есть отношение дисперсии условных средних арифметических 
значений случайной величины U, при! условии, что другая слу- 
чайная величина Z принимает ряд из т фиксированных значений 
(стр. 181), то нетрудно понять смысл проверки однородности ряда 


* Если число значений неодинаково для paix переменных, тогда 


вместо ти общее число наблюдений определяется как Sai rej = 1, 2,....т— 
]=1 
номер случайной переменной, nj — число наблюдавшихся ее значений. 
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средних ‘арифметических значений. Пусть имеется 7 выборочных 
средних арифметических M, М,,...М;..., М и требуется 
установить, изменяются ли они от выборки к выборке (все равно, 
под действием контролируемых или неконтролируемых факторов). 

Тогда по методам, рассмотренным в главе 3, вычисляют общее 
среднее значение (М) этих средних арифметических, рассматрива- 
емых в Качестве условных средних: 


М Ум” (5.2.23) 
à "i GE 
и определяют их дисперсию относительно общего М: 
В Е т, — М?. (5.2.24) 
Dnj 4 | 
j=1 jmi 


Затем рассчитывают выборочные дисперсии D; и среднее ариф- 
метическое из этих дисперсий: 


Про ` n;D;, (5.2.25) 
à" г | 


после чего вычисляют эмпирическое значение Е-критерия: 


D [м]. (> hir n) ; 
j=1 


F, = Do (m—1) 


(5.2.26) 


и осуществляют проверку, аналогично тому, как показано выше 
для сравнения двух дисперсий. Если т средних М, оказываются 
статистически неоднородными, следовательно, можно ожидать 
присутствия явной (при контролируемых) или неявной (при не- 
контролируемых факторах) регрессионной зависимости. 

Пример 5.2.11. В примере 3.3.6 рассматривалась корреляци- 
онная взаимосвязь между статусом на курсе (у) и в своей 
группе (x). Были определены коэффициент детерминации Nje = 
—0,53 и условные средние арифметические значения статуса 
на курсе (см. табл. 3.3.9):- 


М == 4; М. аа Mye 9; М. =92 


Требуется оценить, значима ли детерминация статуса на курсе 
статусом в группе, т. €. N/s — 0, и (что в данном случае то же 
самое) однородны ли четыре указанных выборочных средних 
арифметических значения. 
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По формуле (5.2.22) при mn = 42 и т = 4 получаем 


__ 0,33. (42—4) _ _ 
f= (1—0,33) - (4—1) mi 


Аналогично по формуле (5.2.26) при х n; = 42, т = 4 и вычис- 


ленных в примере 2.3.6 D [M] = Sp [М (y/xz)] ~ 215, 83 и 
— = D, [9/2] zæ 563,47, определяем 


215,83 + (42—4) 
563,47 + (4 —1) a 072, 


Заметим, что одинаковый результат получился потому, что 
формула (5.2.26) является частным случаем формулы (5.2.22).* 

Для проверки гипотез о значимости 1/х и однородности че- 
тырех средних арифметических значений из табл. IX Приложе- 
ния 2 для vı = m— 1 =3 и v, = тп — т = 38 находим: 
Го, 01/з,40 = 4,31 < Fa = 6,2. Следовательно, различия между 
средними не случайны, они должны считаться неоднородными; 
коэффициент детерминации статуса на курсе статусом в своей 
группе является значимым. 

Если Р-критерий используется для проверки однородности 
нескольких средних арифметических, то для проверки однород- 
ности более чем двух дисперсий его применять нельзя. Для про- 
верки однородности нескольких выборочных дисперсий при вы- 
борках неравного объема используется критерий Бартлетта, 
а в случае одинакового объема — более простой критерий Кох- 
рана. 


ЕР. = 


Критерий Бартлетта 


Пусть имеется M выборок, объемом n; и с дисперсией О; Kax- 
naa. Тогда отношение B/C, где 


B =2,3026| (È z п) вв $ o —4)lg D; i 


j=1 


| т т 
1 1 -E 
C= зе ти Ara so T D 7D; 
a Au- Ann 


(5.2.27) 


распределено приблизительно по %? -распределению c m — 1 
степенями свободы, независимо от N; лишь бы все N; > 5. Crego- 
вательно, гипотеза об однородности всех D; принимается, если 


* Обе формулы приведены потому, что для проверки однородности не- 
скольких выборочных средних не нужно вычислять 1] ? и достаточно ограни- 
читься формулой (5.2.26). 
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BJC < Xd os/m-1, и отклоняется, если B/C > Х6о1/т-1. Из ypas- 
нений (5.2.27) можно видеть, что всегда С >> 1, поэтому сначала 
вычисляют B и сопоставляют с критическим значением 54 v. 
Если В = %&, y, то гипотеза об однородности принимается, если 
же нет, то приходится вычислить C. 

Пример 5.2.12.* От учеников шестого — одиннадцатого KAC- 
сов получены оценки по тесту «числовые ряды» (табл. 5.2.10). 
Требуется определить, изменяется ли дисперсия оценок при Ne- 
реходе от младших классов к старшим. Иначе говоря, нужно 

Таблица 5.2.10 

Исходные данные к примеру 5.2.12 


Классы 

6 T | 8 9 | 10 | 11 
135 F 160 15,0 18,0 18,0 23,0 
9,5 13,0 18,5 19,5 19,5 18,5 
12.0 18,5 14,0 17,0 23,5 18,5 
14,0 13,5 15,0 14,5 16,5 16.5 
12.0 17,5 110 20.0 220 | 195 
10,0 11,0 15,0 19,0 19.0 18,5 
14,5 15,0 14.5 23,0 15,0 18,5 
15,5 13,0 13,0 22,0 19,5 21,5 
15,0 18,5 19,0 17,5 25,0 19,5 
120 | 16,5 15,0 13,0 15,5 16,5 
9,0 14,5 18,0 17,5 24,0 20,5 
145 o 16,5 19,5 20,5 17,5 
i 16, 11,5 225 18,0 17,0 
went | 95 | 140 Ор 
-Sj 20,0 10,5 10,0 13,0 21,0 23,0 
14,5 16,5 13,5 17,0 17,5 18,0 
11.0 20,5 10,5 19,0 16,0 18,0 
9,0 16,5 13,5 19,0 22.0 -22.0 
16,5 15,0 18,5 18,0 22.0 16,5 
12.5 13,5 14,5 -24.0 20,5 19,5 
20,0 12,5 14,0 241,5 17.0 220 
14,0 14,0 18,0 17,0 20,0 29.5 
12.0 22,5 20,5 17,5 20,5 19,0 

11,5 46,5 13,0 20,5 16,5 в 

13.0 7,5 14,5 18,5 16,5 + 

А 19,0 =$ 20,0 = 

43,0 А 2x i ea Е 

nj 


Sj= X zij 363,0 | -376,5 | 3890 | 460,5 | 5025 | 447,5 


п; [а ||| & 


26 23 


* См. G.Claus s, Н.Е bner. Grundlagen der Statistik für Psycho- 
logen, Pädagogen und Soziologen. Berlin, 1967. 
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проверить однородность дисперсий но критерию Бартлетта. Про- 
межуточные расчеты представлены в табл. 5.2.141. 


‚ Таблица 5.8.11 


К расчету критерия Бартлетта при неравных объемах выборок 


=. 52 52 < n;—1)X 
: J 1 ис р 3 1 
7 A 41) nj ~ х7;— Е OTA p) lg Dij хр] 
i=1 ; j 
1 | 5100,5 | 4880,3 |- 220,2 26 | 8,47 | 0,9279| 24,1254 
2 5933,2 | 5670,1 263,1 24 10,96 | 1,0398 | 24,9552 
3 6018,0 | 5820,0 198,0 25 7,92 | 0,8987 | 22,4675 
4 8650,8 | 8482,4 168,4 24 7,02 | 0,8463 | 20,3112 
5°| 9874,8 | 9711,8 163,0 25 6,52 | 0,8142 | 20,3550 
6 8807,8 | 8706,8 101,9 22 4,59 | 0,6618 | 14,5596 
m i 
44385,1 43271,4 1113,7 146=m (n—1)| 45,48 aa E NT DS, 
j=1 


; Общую дисперсию D можем определить либо по формуле 
(5.2.27), либо по формуле | 


(5.2.28) 


где обозначения приведены в табл. 5.2.10 и 5.2.41: 
О == 7,63 и № =0,8825. 


Тогда по формуле (5.2.27) ` 
В = 2,3026 . (146 .0,8825 — 126,7739) == 4,77. 


Из табл. УП Приложения 2 находим для у=тр— 1 =0: 
10,01/5 =11,1>> В =4,77, 


следовательно, гипотеза об однородности дисперсий может быть 
принята. 


а-критерий Кохрана 
Кохран показал, что отношение максимально большой из вы- 
борочных дисперсий к сумме всех т сравниваемых дисперсий. 


тах О; 


== (5.2.29) 
2 D; 
J=1 
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зависит только от т и от числа степеней stoni y=n Si. 
где n — одинаковый объем выборок. В табл. X Приложения 2 
приведены квантили С-распределения Кохрана, вычисленные для 
a = 0,05 и 0,01. Проверка гипотез а = ` 
для всех критериев способом. 

Пример 5.2.13.* Требуется сравнить три варианта метода пре- 
подавания (А, Ви С), которые отличаются всего одним призна- 
ком — применением наглядного материала. Был проведен экспери- 
мент, состоявший в том, что каждому из трех равных по объему 
случайных контингентов учеников из параллельных классов пре- 
подавание определенного учебного материала осуществлялось 
только по одному из указанных вариантов. В заключение была 
проведена контрольная работа, результаты которой оценивались 
в баллах. Первичные данные эксперимента представлены в 
‘табл. 5.2.12. Определим, однородны ли дисперсии оценок, полу- 
ченных учениками, обучение которых проводилось с различным 
использованием наглядного материала. 


Таблица 5.2.12 
Исходные данные к примеру 5.2.13 


Метод А | Метод B — Метод С 


9 15 18 

11 16 14 

10 15 17 

12 10 9 

7 13 14 

Оценки в баллах 11 14 17 

(zij) 12 15 16 

(i=1, 2, n) 10 7 15 

п= 15, 13 13 16 

11 15 S 

13 15 14 

114 14 10 

10 № 16 

12 15 15 

Š 13 10 17 
| 

5; 165 198 216 


Вычисляя любым известным способом дисперсии, получаем: 
Эа. & Ов=60 ВЕ 
- Определяем по уравнению (5.2.29) 


9,4 


@ = 27266494 


~ 0,502. 


* См. G.Clauss, H. Ebner. Ук. соч. 
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Из табл. X Приложения 2 для т = Зи v = 16 (ближайшее боль- 
шее, чем у = 14, значение) находим, что Go os = 0,547 > G = 
_ == 0,502, т: е. ро можно считать однородными. 


$ 5.3. основные МЕТОДЫ  ТАТИСТИЧЕСКОЙ 
ПРОВЕРКИ ГИПОТЕЗ 


Выше были рассмотрены методы проверки статистических 
гипотез с помощью специальных критериев. Однако наряду с «кри- 
териальными» методами в математической статистике имеются. 
методы точечного и интервального оценивания, не использующие 
критериев в том виде, как это рассмотрено. K таким методам можно 
отнести метод максимального правдоподобия и метод Байеса — 
для точечного оценивания, классическую процедуру и последо- 
вательный анализ Вальда — для интервального оценивания. 


5.9.1. Метод максимального правдоподобия 


Этот метод, предложенный Р. Фишером, служит для точечной 
оценки любых параметров генеральной совокупности по выборке 
объемом и и состоит в следующем. Е 

Пусть случайная величина Х имеет функцию распределения 
известного вида, определяемую неизвестными параметрами 01, 
9 о... ‚ 9м, которые необходимо оценить по выборке 
значений т, Tai -eo 3 Lje o e, Zp где п — объем выборки. Тогда 
вероятность появиться в выборке любому значению T; зависит 
(для данного закона распределения) только от совокупности из 
N конкретных значений параметров 60;; обозначим эту вероят- 
НОСТЬ | | 

3 Pi (£i, PF 0., e. e. e3 Oy). (5:3-9 


Вероятность совместного появления в выборке п наблюдавшихся 
значений Zi, обозначим ее 


n N 
L [7 z N a). — 582) 


i=1 j=1 


очевидно, является произведением вероятностей вида (5.3.1} 
и называется функцией правдоподобия*: 


x 
51 Tis A 0, м ПР, [= N o) . (5.32 
i=1 j=1 1$=1 7=1 | ' 
п ; 
* Знак [] — это знак пересечения (логического умножения) всех эле- 


A 
ментов, OT i = 1 по п. Аналогично знаку суммы Y) и произведения П он 
Г > . 
t e l 
используется для сокращения записи. 


A - . 


Tias упрощения вычислений на практике чаще используется ло- 
гарифм функции правдоподобия 


log L = Žuer,(2 fi; N Ав). (5.3.4) 


причем в зависимости от P логарифмирование про- 
водится в натуральных (ln), десятичных (lg) или двоичных (logs) 
логарифмах. 

Смысл отыскания оценок для параметров 0; состоит в том, 
чтобы принять в качестве оценок такие значения всех 0 jp при KO- 
торых для выборочных значений 2, функции (5.3.3) или (5.3.4). 
обратились бы в максимум. Математически это задача отыскания 
экстремума функции многих переменных *, и в общем виде она не 
всегда может быть решена. К счастью для исследователей психо- 
логического, педагогического и других смежных профилей, для 
наиболее употребительных функций распределения и их mapa- 
метров эта задача раз и навсегда решена, и можно пользоваться. 
готовыми результатами. А именно, максимизация функции прав- 
доподобия достигается при оценке вероятности частостью, при 
оценке моментов генеральной совокупности выборочными момен- 
тами и т. д., согласно приводившимся выше формулам. При этом 
все, рассмотренные оценки состоятельны, в большинстве случаев 
эффективны и достаточны, но могут быть смещенными (см. 
табл. 5.1.1). Заметим также, что многие формулы рассмотренных 
выше критериев могут быть получены с использованием метода 
максимального правдоподобия. В частности, это формулы (5.2.6) 
и (5.2.9).** В качестве особой разновидности метода максимального 
правдоподобия можно рассматривать и метод оценки апостери- 
орной. вероятности гипотез, предложенный задолго до Р. Фитюра- 
английским священником Т. Байесом. 


5.3.2. Метод Байеса 


Особенностью этого метода является использование априорных 
вероятностей об истинности (или ложности) гипотез, для того 
чтобы на основе’ апостериорных оценок вероятностей событий, 
интересующих исследователя, оценить (в виде апостериорной 
вероятности) истинность и ложность гипотез, т. е. уточнить апри- 
орную информацию опытным путем. 

Пусть P (И) и P (JI) — заранее известные (априорные) Be- 
роятности истинности и, соответственно, — ложности гипотез 
(табл. 5.1.3). Производя опыт, благодаря которому (апостериори) 


* Отыскание экстремума функции М переменных заключается в том, что 
ее дифференцируют в частных производных по каждому из аргументов, полу- 
чая М уравнений, которые приравнивают нулю и совместно решают. В ре- 
зультате и определяются значения оценок 61, 0.,..., y- ) 

** Cm. P. Аткинсон, Г. Бауэр, 93. Кротерс. Введение B ma- 
тематическую теорию обучения. «Мир», М., 1969. 
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определяются условные вероятности P (I/V) — приема истинной 
и Р(ШЛ) — приема ложной гипотезы, можем оценить вероят- 
ность принятия истинной гипотезы 


Р(ПИ) =Р(И)-Р(П/И) = P (1) - P (4/1) (5.3.5) 


и вероятность принятия ложной гипотезы 
Р(ПЛ)=Р(Л).Р(П/Л) = P (T1) - P (JI/T), (5.3.6) 
где полная вероятность принять истинную или ложную гипотезу 
P (TM) + P (JI) =Р(П). (5.3.7) 


Тогда из равенств (5.3.5) и (5.3.7) можем определить апостериор- 
ную вероятность истинности принимаемой гипотезы: 


_ Р(И)-Р(П/И) _ Р(И)-Р(Ш/И) 
РИ — о. < РР 090 


Аналогично из равенств (5.3.6) и (5.3.7) можем определить апосте- 
риорную вероятность ложности принимаемой гипотезы: 
Р(Л/П) = о (5.3.9) 
(IH) -+ P (IJI) ` 
Заметим, что сумма левых — M, соответственно, правых частей 
равенств (5.3.8) и (5.3.9) равна единице, так как принятие истинной 
и принятие ложной гипотезы образуют полную группу событий... 
Равенства (5.3.8) и (5.3.9) называются формулами апостери- 
орных (условных) вероятностей принятия гипотез. Точно так же ` 
можно построить формулы для P (И/О) и P (Л/О) — апостериор- 
ных (условных) вероятностей отклонения гипотёз. Все эти и подоб- 
ные им формулы для произвольного числа гипотез известны под 
названием формулы Байеса: 


Р(Н./А) O PODPOR) (5.3.10) 
2 P (H;)- P (A/H;) 


где H; — i-raa принимаемая (отклоняемая) гипотеза; Л — пол- 
ная группа несовместимых гипотез; P (H;/A) — апостериорная 
вероятность истинности (ложности) гипотезы H; при условии опыта 
А; А — опыт, дающий информацию 06 истинности (ложности) 
{-той гипотезы; P (H) — априорная вероятность 1-той гипотезы; 
Р (А/Н;) — апостериорная веронтуюстр принятия (отклонения) 


{-той гипотезы в опыте А; х F (H, ). P (A/H) = P(A) — полная 


вероятность (см. стр. 36) изя (отклонения) в опыте всех 
гипотез. 

Поясним ‘использование метода Байеса для частного случая 
проверки двух гипотез (или, что то же самое,— проверки истин- 
ности или ложности одной гипотезы) по формулам (5.3.8) и (5.3.9). 
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Пример 5.3.1. Согласно результатам многочисленных исследо- 
‘ваний, только около 80% людей пригодны к профессии оператора 
(летчик, диспетчер энергетического, химического и других произ- 
_ водств и т. д.). Для отбора специалистов-операторов проводятся 
пробы на профессиональную пригодность. При этом, допустим, 
человека считают пригодным к данной операторской профессии, 
если он выполняет 95% проб (специальных заданий), и непригод- 
ным, если он выполняет только 50% проб. Таким образом, дано: 
гипотеза H, — пригоден и P (H) = 0,8; гипотеза H, — непри- 
годен и P (H,) = 0,2; апостериорные вероятности принять гипо- 
тезы: P (M/H) = 0,95 и P (П/Н.) = 0,5. Спрашивается, каковы 
вероятности P (Н!/П) и P (Н./П) того, что среди выполнивших 
95% проб окажутся люди, действительно пригодные к профессии 
оператора и, соответственно, непригодные к ней? 
Пользуясь формулой (5.3.8), определяем 


Е рами 
РТ) Sia yP ONA P i e — 
0,8-0,95 S 

—08:095202:05 ~ 088- 


Точно так xe, пользуясь формулой (5.3.9), определяем 


SA P (H2). P (/H2) e> 
РИ = -S-P 07A) F P a) P a — 


0,2 - 0,5 
— 0,8.0,95- 0,2-0,5 ^^ ое 


Можно видеть, что действительно опыт позволяет уточнить 
априорную информацию. В этой связи допустим, что проведено 
новое испытание для людей, отобранных в первом опыте как про- 
фессионально пригодных. Пусть снова апостериорные вероят- 
ности P (M/H) = 0,95 и P (ПИН) = 0,5. Спрашивается, какова 
вероятность прошедшим и второе испытание оказаться nparo 
ными к операторской деятельности? 

Очевидно, целесообразно использовать а полу- 
ченную после первого испытания. Поэтому вместо априорных ве- 
роятностей P (H) = 0,8 и P (Н,) = 0,2 используем апостериор- 
ные вероятности гипотез P (Н!/П) = 0,88 и P (Н.П) = 0,12. 
Тогда по формуле (5.3.10) вычисляем ` 


Р(Н:/П)-Р(П/Н1)_ _ 088.095 
А, M= m ооо 03 
У Р(ни/П)-Р(П/НИ 


i=l 


Можем видеть, что благодаря новому опыту апостериорная 
вероятность принятия истинной гипотезы еще увеличилась. 
Заметим, однако, что увеличение после второго опыта оказалось 
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меньше, чем после первого опыта. Если бы последовательно про- 
водились все новые и новые опыты, то искомая апостериорная 
вероятность увеличивалась бы, асимптотически приближаясь 
к единице как к своему пределу, при бесконечном увеличении 
количества опытов. Причем за каждое асимптотически уменьша- 
ющееся приращение апостериорной вероятности исследователю 
пришлось бы расплачиваться асимптотически увеличивающимся 
до бесконечности числом опытов. В этой связи возникают две су- 
щественных проблемы: первая — какое число наблюдений (опы- 
тов) необходимо и достаточно провести, чтобы определить искомый 
‘параметр (функцию) с требуемой степенью точности? и вторая — 
как можно распорядиться последовательным накоплением ин- 
формации от опыта к опыту, чтобы по возможности уменьшить 
число наблюдений? . 


5.3.3. Классический метод определения параметра (функции) 


C заданной точностью 


‚Пусть требуется по выборке объемом п оценить параметр 0* 
с априори задаваемой точностью. Мерой точности является OM- 
‘носительная ошибка (первого рода) a, которую, как обычно, по- 
лагают` о = 0,05, или a- = 0,01, где 


а; (5.3.41) 


0 — выборочная оценка параметра 6*. 
Мерой точности также является и абсолютная ошибка (A): 


А=|а. 0*| =|0—6*]|. ` (5.3.12) 
В соответствии с определением доверительного интервала по фор- 
мулам (5.1.5) и (5.2.12) абсолютная ошибка ЛА определяется cHe- 


дующим . образом: 
А = 0 (0)... (5.3.13) 


где о (60*) — стандартная погрешность параметра, определяемая 
формулами из табл. 5.1.2. В частности, для среднего арифмети- 
ческого значения М [X]: 


с [М (X)] = esi | (5.3.14) 
Vn | 
где о [X] — стандартное отклонение, определенное на выборке 


объемом п. 
Подставляя (5.3.14) в (5.3.13) и преобразуя, получим- 


п=- у [X] № (5.3.15) 


Vmax’ 


где А — заданная исследователем абсолютная ошибка опреде- 
ления среднего арифметического значения по формуле (5.3.12) 
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при условии анна по (5. 3. 11) значения 0; ta, Vmax = 1, 96, 
если a = 0,05 и fa, v, „ = 2,58, если a = 0,01; оз [X] =D [X] — 


выборочная дисперсия; п — объем выборки, необходимый и HO- 
статочный для оценки среднего арифметического C точностью до Q. 

Пример 5.3.2. Известно, что для любого субтеста шкалы 
Векслера (тип WAIS), среднее арифметическое значение шкальной 
оценки М = 10, а дисперсия D = 9. Определим число наблюдений, 
необходимое для оценки среднего арифметического значения для 
любого субтеста этой шкалы выборочным путем, чтобы относи- 
тельная ошибка не превышала 5% (т. e. чтобы a = 0,05). 

Абсолютная ошибка по формуле (5.3.12) равна: А = 0,05.109 = 
= 0,5 (шкальной оценки). Тогда по формуле (5.3.15) находим ` 

9.1.962 _ 
Е ЕР 139. 
Следовательно, необходимо и достаточно иметь в выборке 139 че- 
ловек. 

Аналогичным путем из формулы (5.3.13), подставляя в нее соот- 
ветствующую формулу стандартной погрешности искомого Napa- 
метра (нужная формула выбирается из табл. 5.1.2) и преобразуя, 
находят формулу объема выборки, необходимого и достаточного 
для оценки искомого параметра с заданной ошибкой a. Например, 
требуется оценить вероятность P, пользуясь частостью р. Дис- 
персия ошибки o’ (р) = р (1 — р) : п, следовательно, по (5.3.15) 
получаем для @ = 0,05 


(+=) 
s2 jœ 3 
a (5.3.16) 
Е Ia предварительно оцененная по выборке частость. 


Пример 5.3.3. В примерах 1.1.2 и 5.2.7 рассматривалась оценка 
вероятности появления цифры «7» при свободном записывании 
цифр испытуемым. Частость р («7») = 0,108 при объеме выборки 
1300. Спрашивается, какой нужен был бы объем выборки, чтобы 
определить вероятность P («7») с ошибкой в 5%? в 10%? 

Для а = 0,05 по формуле (5.3.16) находим: 


_ 4,962. (1—0,408) 


0,0025.0,408 X 12691 В - 


Аналогично для а = 0,1, учитывая, что & 1, = 1,645, находим: 


1,6452 » (1 — 0,108) 


LEE: 


—= 2235 (наблюдений). 
Таким образом, при n = 1300 частость р («7») = 0,108 измерена 
более, чем с 10%-ной относительной ошибкой. 

Рассмотренный классический метод фактически создан’ для слу- 
чайных выборок из однородных совокупностей. Как же опреде- 
лить объем выборки из гетерогенной совокупности? Если априори 
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известно распределение вероятностей элементов гетерогенной CO- 
вокупности, то в соответствии с классической процедурой можно 
осуществить типический отбор (по схеме независимых испытаний) 
следующим образом. 

Будем рассматривать гетерогенные совокупности, как объе- 
динения гомогенных частей. Тогда простая гетерогенная совокуп-. 
ность рассматривается как состоящая из непересекающихся гомо- 

| генных частей (рис. 5.3.1, а), а 

a z | сложная — как состоящая. из 
пересекающихся или пересе- 
кающихся и непересекающихся 
частей (рис. 5.3.1, 6). 

Пусть простая гетерогенная 
совокупность состоит из $ гомо- 
генных частей, вероятности 
появления которых _Р;, где 
р ни, иЗАббТНы м 


| \/ 
К 


: в сумме равны единице (s — 

> это полная группа событий). 
Тогда из определения вели- 
чины {-критерия Стьюдента по 


Рис. 5.3.4. Гетерогенные совокуп- формуле (5.2.10а) следует: 


ности. z2 y2 
а — простая гетерогенная совокупность Ё = и = 12. 
есть объединение своих непересекающихся y2 fy 22 


м: А == А, -L As t A; + А. -- A; |+ Аз; x s $ м 
— сложная гетерогенная совокупность s DEAA . 
есть объединение своих непересекающихся Нолаг ая vV Ni; Z Д* = a*P 

‚и пересекающихся частей: =А- И; = Р i (4 EN Pij; 


Art AA AATA ai 
+ 4: Аз T Чи ра gist At получаем для оценки $-той Be- 
роятности: 


‘(1 —Р;)/о7Р; 


2 
т УЖ л 
l %, Vmax 


Ù для всех $ вероятностей: 


$ $ 
By? 
N= X u= th, voar Ei (ОТР) 


$=1 ° 1=1 


‘где п; полностью соответствуют уравнению (5.3.16), введенному 
раньше. | 

Аналогично рассуждая, можем рассматривать сложную гете- 
рогенную совокупность как состоящую из $ частей, повторяемых 
т раз, т. €. как матрицу C $ строками и т столбцами, имеющую 
всего L = ms пересечений. Тогда 


Уна У. (5.3.18) 


j=} 1=1 j=1 1=1 
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rae Pi — выборочная частость Й-того пересечения; п = рим — 
частота #-того пересечения, необходимая и достаточная ‘для оценки 
вероятности Р;, с ошибкой не больше Q; пу, рассматривается z 
так же как объем случайной выборки из части гетерогенной COBO- 
купности с пересечением множества фиксированных свойств; 
N — общий объем репрезентативной типической выборки, необ- 
ходимый и достаточный для оценки многомерного распределения 
вероятностей изучаемой гетерогенной совокупности. 

Пример 5.3.4. В примере 5.2.3 было получено объединен- 
ное совместное распределение статуса (X), нейротизма 
(Х.) и эмоциональной экспансии (Х.), полученное на выборке _ 
в 99 человек (табл. 5.2.5). Спрашивается, какой объем выборки 
требуется для оценки этого распределения с ошибкой не более 5%? 

Пользуясь частостями р; из табл. 5.2.5. и формулой (5.3.18), 
осуществим вычисления, как показано в табл. 5.3.1. Результат, 
на первый взгляд, представляется ошеломляющим: М a 260 400 
наблюдений. Однако иного и быть не может, так как дело идет 
об определении функции многомерного распределения, которое, 
как указывалось, из опыта определять нелегко именно по причине 
необходимости очень больших объемов выборки. Покажем, что 
для оценки отдельного параметра миогоморной совокупности 
требуются всегда выборки меньшего объема. * 

Пример 5.3.5. В разделе 4.3.2, оценивая количественные 
характеристики трехмерной системы случайных величин, мы 


Таблица 5.3.1. 


Вычисление объема выборки из сложной гетерогенной совокупности 
(к примеру 5.3.4) 


Код Величина | {—Рит 


0,0025 Рут Пт 


P111 0,03 0,97 0,000075 E TASI 7812 
P112 0,10 0,90 0,000250 3600,0 26 040 
P121 0,04 0,96 0,000100 9600,0 10 416 
P122 0,02 0,98 0,000050 19 600,0 5208 
- P211 0, 05 0,95 0,000125 7600,0 . 13 020 

P212 0,45 0,55 0,001125 488,9 117180 
P221 0,03 0,97 ° - 0,000075 12 933,3 7812 
P222 0,28 0,72 0,000700 ‚1028,6 72 912 

Суммы 67784,1 26 0399 


N = 1,962 . 67784,1 == 260 399;  Nijm = PijmN 


_* Потой простой причине, что отдельный параметр является неполной KO- 
личественной характеристикой совокупности, как мы всегда это подчеркивали. 
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установили, что при выборке в 42 человека средние арифметические 
значения и дисперсии статуса на курсе (Х,), нейротизма (Х.) 
и эмоциональной экспансивности (Х з) соответотвенно. равны: 


MAFRA М (Х.) = 13,2; М (Х.) = 8,9; 
Спрашивается, какого объема следует взять выборку, чтобы оце- 
нить средние арифметические. значения статуса, нейротизма 
и экспансивности с ошибкой, не большей а = 0,05? 


Сначала вычислим по выборочным данным абсолютные ошибки 
и их квадраты: 


А [М (Х,)1 = 0,05. 3,34 =0,167; A} =0,167? ~ 0,028; 
A [М (Х,)1 = 0,05.13,2 =0,66; Аз =0,66? ~ 0,44; 
A [М (Х.)1=0,05-8,9 =0,445; A3 =0,445? ~ 0,2. 


Теперь, учитывая выборочные дисперсии, по формуле (5.3.15) 
определяем 


94. 1,962 _ Е 
—0028 —^ 12486,5 ~ 12487, 


24 . 1,962 
0,44 


404 . 1,962 
а" 


ВЕ = 


№. = z~ 209,6 ~ 210, 


~~ 1760. 


| Можно видеть, во-первых, что, действительно, для оценки 
«среднего арифметического (отдельного параметра) нужно почти 
в двадцать раз меньше опытов, чем для оценки трехмерного рас- 
пределения (предыдущий пример). Во-вторых, чем меньше вели- 
чина оцениваемого параметра по сравнению с дисперсией, тем 
‘больше требуется опытов для оценки с заданной точностью. В ma- 
лем случае фактически требуется исследовать максимально №. = 
— 12 487 человек. При этом остальные переменные (X, и Х,) 
‘будут в среднем измерены с более высокой, чем X 4, степенью TOY- 
ности. Если же попытаться сэкономить в числе опытов, ориенти- 
руясь на минимальное N, = 210, тогда среднее арифметическое 
M [Х/ окажется оцененным с весьма большой ошибкой: 


а[М(Х,), М =N] ть т, № =М№;] :М(Х) = 


1 
—=——. - 1,96 ~ 0,4. 
3,34 a 
Fen образом, чтобы оба измерения одноименных парамет- 
ров для нескольких разнородных случайных величин с точностью 
не меньше заданной, необходимо делать выборку максимального 
объема (из числа требуемых). 
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Как показано, классический метод определения необходимого 
и достаточного объема выборки зачастую приводит к очень боль- 
шому числу требуемых наблюдений. Можно, однако, при опреде- 
ленной организации исследования, обойтись меньшим числом 
наблюдений, не проигрывая в точности. Такая организация 
достигается при изучении изменчивости средних арифмети- 
ческих средствами дисперсионного анализа (глава 6), а при 
проверке статистических гипотез ‚ относительно отдельных пара- 
метров — последовательной процедурой А. Вальда. 


5.3.4. Метод последовательной проверки 
статистических гипотез 


Этот метод, предложенный А. Вальдом, в настоящее время 
изучен липть для некоторых законов распределения и применяется, 
главным образом, для оценки двух вероятностей и средних зна- 
чений.* Существо последовательного. (секвенциального) анализа 
состоит в следующем. 

Вальд дополнил альтернативное поведение при классической 
проверке гипотез третьим исходом: продолжить испытания, если 
нет достаточных оснований принять одну из гипотез, и. пред- 
ложил использовать так называемое отношение правдоподобия, 
которое является отношением двух функций правдоподобия 
(5.3.3), одна из которых соответствует гипотезе Н,, а дру- 
гая — альтернативной гипотезе Ну. 

Пусть имеется некоторая выборка значений z; случайной 
‚величины X (i =1,2,.., n), для которой известна плотность 
вероятности f (x, 9), зависящая от рассматриваемого параметра 0. 
Пусть, далее, проверяются гипотезы: Hg, состоящая в том, что 
9 = 0,, и H, состоящая в том, что O = 0,. Тогда отношение прав-. 
доподобия в соответствии. с (5.3.3) можно записать так: 


вая 7 (té 91) 
= п в (5.3.19) 


или, в логарифмической Е 


ig L=lg P, —lg р Lg f (а, 01) —1е f (£, 0,)]. (5.3.20) 


1=1 


Этот логарифм отношения правдоподобия вычисляется после 
каждого 7-того испытания и сравнивается с доверительными 
пределами, которые определяются исходя из выбранных значений 
вероятностей ошибок первого (a) и второго (В) рода. 


* Хотя в принципе может быть применен для сравнения любых двух 
параметров с известной функцией распределения, что TpeDyeT, однако, спе- 
НС разработки. 


333 


Таблица 5.3.2 _ 


Формулы для определения границ областей поведения при проверке гипотез по методу последовательного анализа 


Свободный член для гипотезы | Свободный член для гипотезы — | 


Вид распределения Угловой коэффициент k о: ho В А 
Биноминальное (сравниваются две = Ро 1—9 & 
вероятности Po и P1) Pı Tin Pi Pı Tap: P, TEP н 
т ВЫ TE DA AAS 
| AET IREAS TSA Вр, Ea pa Е" 
Нормальное (сравниваются два Mı (X) + M2 (X) 9%) g e D (X) Jg tok "i 
средних арифметических) 2 Ma (XY — M(X) CHE | М: (Х)—Мо(Х) E 


Экспоненциальное (сравниваются 


ig Ai jy В T 1 —В 
два значения параметра Аб... 1-2 @, {© 
вк Г ещо ааа те A 
KS F) ; Àr — № Ai — Ло А1 — Ло 
D(X) | 
ь N no $ 
Во всех случаях подсчитывается ПТ ЯРО, > Tij h где для биномиального распределения tij = KA 
; i=ft 1=1 \7=1 ` 5 i 
, xX 
aea SOPI E 7 a © e и Г 
a= bia р CORINA НН ‚ для нормального и экспоненциального распределении zij — это наблюдаемое 


в #]-той группе из $ опытов (s © 1) значение случайной величины X. 4 y ni 


= 


_Доверительные пределы нетрудно найти по следующим о - 
жениям. Если исходы проверки гипотез независимы, то условные 


вероятности принятия истинной И ложной гипотез, а также OT- 


клонения истинной и ложной гипотез равны (табл. 5.1.3.): 


1 -а=В, | ое 
В. (5.3.216) 
Тогда из (5.3.21а) определяем нижний предел: 
В 
т =, _  (5.3.22а) 


и из (5.3.216) определяем верхний предел: 
и? (5.3.226) 


Логарифмируя эти пределы и сопоставляя их с величиной JOTA- 
рифма отношения правдоподобия на каждом 1-том «шаге» после- 
довательного м осуществляем выбор поведения: если 
lg L< lg [P/(1 — a)l, то принимается гипотеза Ho, если lgl = 
— № [(1 — )/al, то принимается гипотеза H, если 1е[В/(1 — 
— а)| < 12 < № И — В)/а]|, то продолжаются испытания — до 
тех пор пока не будет принята одна из двух проверяемых гипотез. 
При этом нет нужды каждый раз вычислять 107, и значения npe- 


_ делов. Специальными преобразованиями для основных функций 


распределения получены линейные уравнения для нижнего (то) 
и верхнего (m) пределов: 


m, (n)=h+kn и т (п) =. Ёп, (5.3.23). 


где п — последовательно увеличивающееся число испытаний, 
а значения k, hon hk представлены в виде формул в табл. 5.3.2. 
С использованием этих формул последовательная процедура осу- 
ществляется следующим образом. Выбираются O; и 0}, как пра- 
вило, по априорным соображениям. Затем Бира аи В. 
Вычисляются k, hon hi. Далее по одному (или группами в s единиц) ^ 
осуществляются испытания и для каждого Г-того испытания 
Ел, п, МЛ Е о... 5 Banan- 
вается сумма 


о |; =) : (5.3.24) 


i=} iet \7=1 


которая сопоставляется со значениями Mo и Mı, вычисляемыми 
0 1 


_ при n = i, как показано на рис. 5.3.2. Одна из гипотез прини- 


мается, как только точка с координатами [т,, il пересечет одну 
из граничных линий. 

Подробнее остановимся на ограничениях к использованию 
процедуры Вальда. Во-первых, последовательный анализ до сих 
пор хорошо разработан и доказан для сравнительно простых 
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_ однородных совокупностей, полученных в независимых испыта- 
ниях. Во-вторых, нужно быть уверенным в виде закона распреде- 
ления совокупности. В-третьих, следует предварительно устано- 
вить эффективность последовательной процедуры по сравнению 
с классической. Хотя Вальд показал, что при последовательной 
процедуре одна из гипотез будет в конце концов достоверно при- 
нята, все же число наблюдений может оказаться больше, чем при 
классической процедуре. Чтобы до опыта оценить оффективность 
последовательного анализа, необходимо, пользуясь априорными 
данными, определить число наблюдений, требуемое по классиче- 
ской процедуре (N), и число «шагов» последовательного анализа (v). 


т, =Й,* КП 


Рис. 5.3.2. Пояснение npo- 


а. верки гипотез при носледо- 
| вательном анализе. 
=h +КП п — число испытаний (п = 1); т 


определено в тексте формулой 
(5.3.24). Область т; < то (1) соот- 


ветствует принятию гипотезы Но, 

область т, > m, (1) соответствует 

принятию гипотезы H, в середине 

между линиями границ — область 
n продолжения испытаний. 


m(t) >M, > mifi) 


Число шагов V является случайной величиной, зависящей OT 
степени «близости» гипотез (разница: 9, — 0o), от величин аи В 
и от вероятности истинности (ложности) гипотез. На практике 
по априори выбранным Q, В и соотношению значений параметров 
O, и 0, оценивают математическое ожидание числа шагов, за KO- 
торое окончится последовательный анализ: М (v, Ho) — для upa- 
HATHA гипотезы Ho, если она истинна, М(у, Hi) — для принятия 
гипотезы H, если она истинна, и М (v) — в наихудшем случае, 


когда 0 = 0,5 (0, + 0,). Формулы для априорной оценки этих. 


величин приведены в табл. 5.3.3. 
| Эффективность nGe TENORA ROTO анализа оценивается по 
формуле | 
Эф = 1 —М (v): Х. — а) 


Очевидно, что при Эф >> 0 последовательную процедуру стоит пред- 
почесть классической, если позволяют ограничения. Заметим, 
‚ что указанные выше ограничения снимаются, если исследование 
ведется с применением психометрических шкал и методов.* 
Пример 5.3.6. При измерении интеллигентности взрослых 
с помощью вышеупомянутой шкалы Векслера получаемые оценки 
нормально распределены со средним арифметическим значением 


100 единиц и стандартной ошибкой ne onee 2 единиц JQ. Для. 


"2, А, FEER В. А. Бодров: Применение одного статистиче= 
ского алгоритма разделения входных ситуаций на классы для определения 
профессиональной пригодности. «Вопросы психологии», 1967, № 1. 
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Таблица 5.3.8 


Формулы для априорной оценки среднего числа шагов (v) последовательной процедуры Вальда 


иинэчкощохА) *‘а 1 Zz 


; Для принятия «нуль-гипотезы, Для принятия «альтернативной» | в самом ‘неблагоприятном случае | 
Вид распределения если она истинна гипотезы, если она истинна М (v) SRR OUEN 
(v, Ho) M (v, Hı) 
p 1— Ap ] EER E (6) а 
Биномиальное распределе- | Е ато ал р ре -= а с 
ние Se 
Polg: FHUP) g- T P: 1g ZL и - Р-Р 
— Po Ре 
ыы 1 т В 14- В 
ион É | ве ча ВЕТ 
Нормальное распределение: Mı (X)—M, X) 5 poaa TLE TAA 
o (X) f o (X) | с (X) 
| | г ви: 
D (X). 
В Tp а Ь В ПА 
кспоненциальное распре- ит Aa ao О T E e FE ( Ал у 
и ЗАО Р.Р Зы левы. Ty 38 
деление i lg io 7 ] тр pi | g P 
OA ° 4 


LEE 


выборки из десяти восемнадцатилетних школьников (8 — 10-го — 
классов) было установлено, что М [IQ] = 98,7 и D ПО] = 388. — 
Однако из предыдущих исследований известно, что у восемнад- _ 
цатилетних взрослых [Q > 100. Спрашивается, сколько испыта- 
ний следует провести, чтобы проверить: Ho — является ли средний 
уровень интеллигентности нормальным (М. (ZQ) = 100) или H, — 

он значимо выше средней нормы (М, (ZQ) = 102)? 

Согласно классическому методу оценки параметра с заданной 
степенью точности, по формуле (5.3.15) находим при a = В = 0,05: 


38.1962 
не аа, 


Для выполнения последовательного анализа вычислим логарифмы 
пределов: | 


a~ 37 (человек). 


lg [В/(4 —a)] = lg (0,05 : 0,95) ~ — 1,2790; 
lg [(1 — ß)/a] = lg (0,95 : 0,05) = 1,2788. 


Далее, по формулам из табл. 5.3.9 для нормального распределения 
получаем: 


0,95 - (— 1,279) 0,05. 1,2788 


М, Н) = - ~ 11 (человек), 
EREN 
Me Aj- а a11 (человек), 
38 
. оО, (2 
М (v) — си риа æ 17 (человек). 


38 
Определяем для М и М (v) эффективность последовательного aHa- 
лиза по формуле (5.3.25): 
Эф=1—--==0, 24. 


Следовательно, имеет смысл воспользоваться последовательным 
анализом. 

По формулам и из табл. 5.3.2. для нормального распределения 
вычисляем значения k, ho и hi: 


k= 0;5 (102+ 100) = 101, h= F о = 94.3. 


a 096 
Е. ls 005 ~ 24,3. 


Таким образом, получаем уравнения границ: 


т, = 101. п — 24,3; m, = 104. n + 24,3. 
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а: Таблица 5.3.4 
Реализация последовательной процедуры к примеру 5.3.6. 


m ; 
i=n Kj m=) Xi M= 101n— 24,3 m,=101n+ 24,3 
1 111 111 76,7 125,3 
2 106 241 £ KIT 226,3 
3 95 312 218,7 321,3 
4 101 413 379,7 428,3 
5 100 513 480,7 529,3 
6 100 613 581,7 630,3 
7 98 741 -682,7 734,3 
8 97 808 783,7 832,3 
9 90 898 884,7 933,3 
10. 89 987 985,7 1034,3 - 
14 143 1100 1086,7 1135,3 
12 116 1216 1187,7 1236,3 
13... 117 1333 1288,7 1337,3 
14 114 ` 1447 1389,7 1438,3 


Далее, не прибегая к графическому изображению, реализуем 
° последовательное, по уравнению (5.2.24), накопление суммы M, 
вычисление значений границ т. (i) и т, (i) и их сопоставление, 
как показано в табл. 5.3.4. В результате уже при п = 14 оказы- 
вается, что M44 > M, (14) и, следовательно, можно принять TANO- 
тезу H, — уровень интеллигентности восемнадцатилетних CTAP- 
шекласеников больше среднего JQ шкалы Векслера. , 

В заключение отметим, что использование вместо «единичных» 
групповых наблюдений оказывается полезным для ускорения 
завершения последовательного анализа, но при этом неизбежен 
проигрыш в эффективности... 


20* 


} 


Глава 6 


ОСНОВЫ ДИСПЕРСИОННОГО АНАЛИЗА 


$ 64. ПОНЯТИЕ O ДИСПЕРСИОННОМ АНАЛИЗЕ 


Имеется несколько переменных факторов, которые либо клас- 
сифицированы, либо упорядочены, либо, наконец, измерены. 
Требуется установить, влияют ли эти факторы на изучаемую 
переменную (СВ или СФ). Исследование влияния переменных 
факторов на изучаемую переменную по дисперсиям называется’ 
дисперсионным анализом (ДА). 


6.1.1. а дисперсионного анализа 


Пусть изучается случайная величина Х, о которой известно, 
что при определенном комплексе условий X имеет генеральную 
дисперсию Do [X]. Требуется проверить, влияет ли на X некото- 
рый фактор (условие) А, до сих пор не принимавшийся во внимание. 
Проводится серия наблюдений переменной Х при условии А (при 
действии фактора A) в дополнение к предыдущему комплексу 
условий. В результате получаем выборку из п значений X: (£4, 
Lz, 1:3,..., Zn), имеющую дисперсию D [X]. Очевидно, что если 
фактор А не влияет на X, то D [X] = D, [X] — в идеальном слу- 
чае. Практически это не так, но различие не должно превзойти 
случайного (с заданной степенью надежности), что легко опреде- 
ляется по Р-критерию Снедекора — Фишера. Иначе говоря, при 
D [X] ~ D, [X] — в пределах случайных флюктуаций, можно 
считать, что либо фактор А не влияет на Х, либо это влияние 
несущественно при данном объеме (п) выборки. | 

Если D [X] > D, [X], иэто не случайно, то приходится приз- 
нать, что фактор А влияет на переменную Х. Тогда, считая 
действие фактора А независимым от других условий, можем 
написать: 


ЕВЕ. (6.1.1) 


где D, [X] — дисперсия, обусловленная случайными влияниями 
неконтролируемых условий; Da [X] — дисперсия, характеризу- 
ющая влияние фактора А на изучаемую переменную X. 
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Влияние фактора А на переменную Х может Cuir различным. 
Здесь выделяются три случая. Первый случай: фактор А может 
влиять только на среднюю величину Х, тогда Da [X] есть харак- 
теристика рассеивания средних значений переменной Х под вли- 
янием фактора А. Второй случай: фактор А влияет только на рассе- 
ивание значений X, T. e. на D, [X]; тогда D) [X] есть некоторая 
«добавка» к D, [X], выражающая степень ‘влияния фактора А. 
Третий случай: фактор А влияет и на М [X] ина D, [X], тогда 
Da [X] суммирует эти влияния. 

Если имеет место второй или третий случай, то влияние фактора 
А можно учесть, применяя параметрические и непараметрические 
критерии, меры корреляции, уравнения регрессии. Если же имеет 
место первый случай, то, наряду с рассмотренными методами, 
применяют дисперсионный анализ. Иначе говоря, ДА исполь- 
зуется лишь в первом случае. Его мы и будем рассматривать 
в этой главе. 

Пусть теперь в дополнение к фактору А требуется испытать 
влияние фактора В. Здесь возможны два варианта: 1) факторы А 
и В независимы и 2) факторы А и В зависимы. Рассмотрим эти 
варианты отдельно. 

1) Факторы А и В независимы. Проводится новая серия на- 
блюдений над переменной X при условии, что кроме А на М [X] 
действует фактор В. В результате получаем выборку из п значений 
перемевной X, имеющую дисперсию 0*[Х]. Очевидно, что 


D*{X]=D{[X]+ Dg [X], ° (6.1.2) 


где Dp [X] — доля дисперсии, обусловленная действием фактора 
В. Если влияние фактора В значимое (согласно Р-критерию и при- 
нятому доверительному уровню), то член Dg [X] существенно 
отличен от нуля. Подставляя (6.1.1) в (6.1.2), получаем для двух 
факторов А и В: 


D* [Х1= 2, [ХА (ХЕ DXI; (6.1.3) 


где в левой части — общая дисперсия выборки, а в правой части 
члены Da[X] и Ов[Х] выражают долю рассеивания средних зна- 
чений М [X] ‘переменной X под влиянием факторов А и В соответ- 
ственно; член О.[Х|] выражает случайные флюктуации пере- 
менной под влиянием всех других (не. А и не В) факторов (условий) 
опыта; этот член называется остаточной дисперсией. 

Заметим, что в (6.1.2) член D [X] выражал влияние (в общем 
случайное) всех других, кроме В, факторов (в том числе и А); 
это тоже остаточная дисперсия. Вообще под остаточной диспер- 
сией понимается часть общей дисперсии выборки, которая 
не входит в долю Ни 954 по данному фактору или группе 
факторов. 

ra) Факторы А u В зависимы. Тогда помимо трех слагаемых 
в правой части (6.1.3) появляется еще одно слагаемое: | 


D* [X] = D, [Х]-+- Da [X]+ Ов[Х] + Элв[Х]. — (6.1.4) 
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Слагаемое Dag [X] выражает долю общей дисперсии D* [X], 
‘обусловленную совместным влиянием факторов А и В на матема- 
тическое ожидание изучаемой переменной X. 

Обобщим сказанное о двух факторах на произвольное коли- 
чество факторов. Пусть на случайную переменную X с генераль- 
ной дисперсией D, [X] влияет т факторов: A, А,,..., Ам. 
Тогда, если эти факторы независимы попарно и в совокупности, 
то | 


о] = D, [X] + БА, [XI 4 БА, [X] +... АХ, (6-4.5) 


где D [X] — общая дисперсия выборки, полученной при воздей- 
ствии указанных факторов A4, А,,..., Аш; Do [X] — генераль-. 
ная дисперсия, которую мы здесь принимаем за остаточную дис- 
персию. 

Члены РА, Xl бра т) выражают парциальное 
действие соответствующих факторов на математическое ожидание 
переменной Х. Если факторы попарно зависимы, то к (6.1.5) 
добавляются справа слагаемые, выражающие совместное действие 
всех возможных пар факторов; число таких слагаемых опреде- 
ляется числом сочетаний из M по 2. Если факторы к тому же за- 
висимы по три, по четыре и так далее — по M, то добавляются 
еще члены, выражающие долю в общей дисперсии сочетаний 
факторов по три, по четыре и так далее. 

На основе сказанного можно видеть, что общая дисперсия 
выборки, полученной при влиянии M факторов, определяется 
как дисперсия суммы M + 1 случайных величин (см. стр. 233), 
‚где дополнительная случайная величина отображает влияние 
неучитываемых условий (ей соответствует остаточная дисперсия). 
При этом для независимых факторов общая дисперсия есть линей- 
ная сумма факторных и остаточной (всего т + 1) дисперсий, 
а для зависимых (в общем случае) сюда добавляется сумма диспер- 
сий всех факторных взаимодействий по два, по три и т. д. — по т. 

Таким образом, сущность ДА состоит в том, чтобы предста- 
вить общую дисперсию в виде суммы дисперсий, обусловленных 
влиянием контролируемых и неконтролируемых условий опыта и, 
оценивая дисперсионные отношения, определить меру влияния 
контролируемых условий (факторов) на средние значения изуча- 
емой переменной. 


6.1.2. Предпосылки диеперсионного анализа 


Как мы видели, одной из предпосылок анализа дисперсий 
является использование Р-критерия Снедекора — Фишера для 
проверки значимости влияния факторов. Поскольку Р-критерий 
базируется на предположении о нормальном распределении гене- 
ральных совокупностей, из которых взяты выборки, то это обсто- 
‚ятельство весьма существенно для возможности применения рас- 
сматриваемого метода в целом. Дисперсионный анализ следует 
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применять только тогда, когда _известно (или доказано), что 
выборки нормально распределены. Это первое важное нь 
грамотного применения ДА. В противном случае истинность вы- 
водов ничем не обоснована и не гарантируется. 

Второй предпосылкой ДА является, как показано, выделение 
факторных и остаточной дисперсий из общей дисперсии. Чтобы 
это выделение было возможным, необходимо, чтобы остаточная 
дисперсия не изменялась от опыта к опыту под влиянием контро- 
лируемых или неконтролируемых факторов. В противном случае 
изменения остаточной дисперсии не позволят однозначно решить, 
что вносят в рассеивание средних данных контролируемые фак- 
торы. Поэтому, прежде чем применять дисперсионный анализ, 
необходимо убедиться в том, что дисперсия выборочных серий 
не меняется однонаправленно от серии к серии. Если такое изме- 
нение происходит, необходимо стабилизировать дисперсию*, и 
лишь потом применять ДА. 


6.1.3. Задачи дисперсионного анализа 


Основная задача ДА состоит в том, чтобы из произвольного 
числа факторов, могущих (как предполагается априори) влиять 
на изучаемую переменную, выделить сравнительно небольшое 
количество факторов, влияние которых наиболее существенно. 
Эта основная задача ДА, смотря по обстоятельствам, конкрети- 
зируется по-разному. В частности, иногда выделяют два этапа 
ДА. Первый связан с оценкой общего, недифференцированного. 
влияния одного или нескольких факторов на среднее значение 
изучаемой переменной. Второй этап состоит в исследовании специ- 
фического, парциального действия факторов. 

Оценка общего влияния факторов позволяет сравнительно 
быстро минимизировать первоначально обычно большое коли- 
чество факторов. В результате первого этапа ДА многие из априори 
выбранных факторов отбрасываются как несущественные. Остав- 
шееся небольшое количество факторов затем исследуется подробно, 
для того чтобы определить «вес» каждого из факторов и факторных 
комбинаций. 

Таким образом, конкретизация основной задачи ДА может 
идти в трех направлениях: во-первых, в оценке общего влияния 
одного или нескольких факторов, во-вторых, в оценке парциального 
влияния отдельных факторов и, в-третьих, в оценке парциаль- 
ного влияния различных комбинаций факторов. Отметим, что по- 
следнее позволяет обоснованно осуществить выбор между линей- 
ной или нелинейной авпроксимациями регрессии. 

До сих пор мы предполагали генеральную дисперсию О. [Х] 
известной и оценивали действие нового фактора, сравнивая две 
выборки: выборку. с новым фактором и выборку без него. Но 


* О методе стабилизации дисперссии см. в кн.: Е. И. Пустыль- 


ник. Статистические методы анализа и обработки наблюдений. «Наука», 
M., 1968, стр. 167—168. 
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обычно имеется всего одна выборка, которая состоит из наблю- 
‘дений, полученных при различных сочетаниях нескольких фак- 
торов, о влиянии которых отсутствует априорная информация. 
Требуется по этой выборке определить генеральную дисперсию 
и оценить нарциальное и совместное действие всех исследуемых 
факторов. Тогда практически задача состоит в «расщенлении» 
общей дисперсии выборки на слагаемые, выражающие влияние 
факторов и остаточную дисперсию. После этого требуется прове- 
‘рить, значимо ли влияние факторов по отдельности и в комбина- 
циях, и на основе результатов проверки отобрать факторные ком- 
бинации, существенно влияющие на исследуемую переменную, 
для их дальнейшего детального изучения. 


6.1.4. Виды диепереионного анализа 


Планирование и проведение эксперимента, а также схема об- 
‚счета данных существенно зависят от числа исследуемых факторов, 
от количества градаций (уровней) каждого из них, от количества 
повторных (параллельных) испытаний, от того, все или только 
некоторые сочетания факторов на всех уровнях исследуются. 
В соответствии с этим выделяют следующие виды ДА. 

В зависимости от количества факторов (А): однофакторный 
(k = 1), двухфакторный ( = 2), трехфакторный (k = 3) ит. д. — 
многофакторный (мультифакторный, при произвольном А) ДА. 

В зависимости от количества градаций (т) каждого из факто- 
ров выделяют ДА на двух-, трех-, четырех- и т. д. уровнях. 
В этой связи обычно говорят об уровнях организации (планиро- 
вания) А-факторного эксперимента, т. e. о ДА k-m, где К — число 
факторов, а M — число их градаций. Обычно стремятся, чтобы т 
было для всех А одинаково. Это значительно упрощает ДА. 

В зависимости от того, есть повторные испытания при каждом 
сочетании факторов на каждом уровне или они отсутствуют, 
выделяют ДА без повторных (параллельных) испытаний и ДА 
с повторными испытаниями. В последнем случае также стремятся, 
чтобы число повторных испытаний (п) для всех А; т, было одним. 
и тем же. Но в общем случае оно может быть переменным, и это 
несколько усложняет расчеты. 

Наконец, в зависимости от того, все ли сочетания факторов 
на всех уровнях (К; - ту) используются в исследовании или же 
часть таких сочетаний пропущена, выделяют полный факторный 
и дробный факторный ДА. 


$ 6.2. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ 


Здесь будем рассматривать принципиальную схему такого ДА, 
когда имеется всего один фактор А, исследуемый на произвольном 
количестве (mM) уровней. При этом, в сущности, не важно, какие 
значения принимает фактор А на каждом из рассматриваемых 
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уровней, 1 т. е. не важно, как эти уровни количественно определе- 
ны, лишь бы это было недвусмыеленно. Одним из уровней может 
быть и отсутствие фактора А. Рассмотрим два случая такого ДА: 

при одинаковом количестве параллельных испытаний на каждом 
из. уровней и при разном их количестве. | | 


6.2.1. Схема расчета ‚при одинаковом количестве 
повторных испытаний 


При одинаковом количестве параллельных испытаний мы. 


имеем схему эксперимента т Х п, где т — число уровней фак- 
тора А; (j =1, 2, 3,..., m) и п — количество параллельных 
испытаний на каждом ]-том уровне. Результаты этой схемы табу 
руются, как показано в верхней части табл. 6.2.1. 

| Таблица 6.2.1 


Исходная rabini однофакторного ДА при одинаковом количестве 
повторных испытаний 


Уровни (7) фактора А 


U= E; 2, 3, e èo ù% 3) m) 
д, | А» | As | А 
AEE 
ari = 4 1 Til ; 412 713 Tim 
SE. 2 £21 122 223 Lim 
IA 3 T31 T32 T33 ; Tgm 5 
O £ E № =т.п 
ое А. 
Du E n Tni Tn? Tn 3 Tnm 
m 
Sal 
> 
т, m: т п, 
\ o 
zij=8S 51 So 5 СР АХ, ФН 
1=1 j=1 7=1 1=1 
m 
5 ši Š p | 5 nA Nea 
M [#1] =t} z1 T2 T3 O E т E 
1=1 


waa 


=” > 
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Прежде всего необходимо убедиться в стабильности дисперсий 
по уровням, применяя критерии Бартлетта или Кохрана. Если 
дисперсии нестабильны, их нужно стабилизировать. Дальнейшая 
процедура состоит в разложении общей дисперсии совокупности | 
на части, соответствующие рассеиванию внутри уровней и между 
уровнями, т. €. надо определить в явном виде уравнение (6.1.1). 
Для этого необходимо вычислить и проанализировать соотноше- 
ние определенных сумм квадратов, показанных в нижней части 
- табл. 6.2.1. 

Общая дисперсия выборки, показанной в Табл. 6.2.1, опреде- 
ляется как 


р[х] = т У Уи. ‚ (6.2.4) 


Разложим двойную сумму в формуле (6.2.1) на составляющие ее` 
части, одна ‘из которых выражает рассеивание внутри уровней 
(столбцов табл. 6.2.1), а другая — рассеивание между уровнями. 
Это разложение представлено следующим уравнением: 


si 


2 2 (=. "7 > (т, — т)? + ‚У (т, <= (6.2.2) 


j=l 


Нреобразуя члены этого уравнения и вводя обозначения, получаем 
рабочие формулы для вычисления сумм квадратов отклонений: 


т a т п 7 В 2 Ì 
O a a >, 
j=1 i=1 j=1 i=1 j=1 i=1 
т n m n : m n 2 
5 (=r =X У -— | Уз, |. f (6-23) 
j=1 i=1 ]=1 #=1 j=1 \#=1 : 
т 5 m n 2 т п 2 
С 1 
Ол=п Е) оке =, FEN- у zu) š 
j=1 j=1 \i=1 / j=1 i=1 / 


Из уравнений (6.2.3) легко видеть, что всегда 


а 5 (6.2.4) 


Тенерь, чтобы получить соответствующие дисперсии, нужно 
равенство (6.2.4) почленно разделить на число степеней свободы. 
Но прежде чем идти дальше, нам придется разобраться в одной 
распространенной ошибке. 
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Создатель дисперсионного анализа Р. Фишер предложил 
вычислять дисперсии с учетом их числа‘степеней свободы, а именно: 


) 
г, | 
D, [X] = TE а (6.2.5) 
a 
ее | 


При таком расчете. дисперсий общая дисчерсия есть средняя ариф- 
метическая случайной и факторной дисперсий, взвешенных по 
числу степеней о 


р 2 == D, [X] -+ Z -Da [X]. (6.2.6) 


При m = 2 n n = 2 дробные множители перед Do [X] и Da [X] 
в уравнении (6.2.6) всегда меньше единицы, т.е. всегда 


D [X< D, [X]+D4 IX]; 


и основное уравнение дисперсионного анализа — уравнение 
(6.1.1) — оказывается нарушенным. Заметим при этом, что общая 


дисперсия D [X] = вычисляется правильно. Следова- 


тельно, по методике Фишера всегда получаются завышенные 
значения D, IX] и Da [X]. К сожалению, методика расчетов по 
Фишеру излагается почти во всех руководствах по математиче- 
ской статистике *. Учитывая это, мы сначала будем рассматри- 
вать для примера метод Фишера, а затем излагать ДА так, чтобы 
основное уравнение (6.1.1) не нарушалось. 

Результаты ДА всегда представляют в виде таблицы, где ука- 
заны: вид вариативности, значения сумм квадратов отклонений, 
согласно уравнениям (6.2.3), количества степеней свободы, оце- 
ниваемые дисперсии и (часто) — граничные значения Р-критерия 
и доверительная вероятность. 

Результаты ДА по методике Фишера представлены в табл. 6.2.2. 
В табл. 6.2.3 показаны результаты ДА по исправленной методике 
вычисления дисперсий. Можно видеть, что различия между 
этими методиками, как и указывалось, затрагивают ‘только 
способ вычисления дисперсий и порядок проверки дисперсионного 
отношения, но не затрагивают основной процедуры расчета сумм 
квадратов отклонений. 


*В. А. Авилов. Дисперсионный анализ. В кн.: Методика и техника 
статистической обработки первичной социологической информации. «Наука», 
М., 1968. 
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Таблица 6.2.2 


Табулирование результатов ‘однофакторного ДА по методу Фишера. 
при одинаковом количестве повторных испытаний на всех уровнях 


© 
' HÒ ' a = 
y Е | Bè eÈ || СЕ 
[> 
м z во Е’ Е: S Ta, Значение критерия 
|=. = Tao = Oo 
mE 2E] ВЕН | 348 ЗЕЕ т 
= = о 
MGE | бав LES SFE ОЕЕ 
Mar iie Paepe 2y | © |544 
Š я т : 
торная). оу т—1 | 0 [Х] nD; [Xį+Đ0 [X] 
Das ее Во [Х 
Внутри уров- НЕ Qo о [X] 
ная) 
o6 Q 
eS Е S Z 
5 Tabauya 6.2.3 


Представление результатов однофакторного ДА по исправяенному 
методу при одинаковом количестве повторных иепытаний на всех 


уровнях 
к-т с 
| 88 |ь, = ЗЕ 
= СЕ DOS EA Omg 
E РИ GS Ея, 8 ие к Ее 
За PES -Fo ЕЕ начение критерия на >. 
E poep Sis |o RE FE 
DT СЯ | Не ФЕ RO >. 
Между  уров- | В = 0,01 
нями (фак-| Qa | т-—1 О, [Х] À 
торная) | Fa Do prasa [Х] или 
Е. _ Во [Х] 
Внутри уров- В = 0,05 
ней (случай-| Оо |тп—1| Оо[Х] — 
ная) 
Общая О |mn—1| D[X] | (Не) Значимо 


_ Общее количество степеней свободы для вычисления всех 
дисперсий в табл. 6.2.3 одинаковое: тп — 1. Тогда искомые дис- 
персии определяются следующими уравнениями: 


Q ) 
РА иг, 
DIX] ==“, E 
Dear] 
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Легко видеть, что в уравнениях (6.2.7) сохранены ‘равенства 
(6.1.1) и (6.2.4), тогда как по Фишеру сохранено лишь равенство. 
(6.2.4), а основное равенство ДА (6.1.1) нарушено. 
По Фишеру сначала определяют дисперсионное отношение 
оцениваемых компонент дисперсии, а затем вычисляют сами дис- 
персии (см. табл. 6.2.2). По исправленной методике ДА сначала 
непосредственно из сумм квадратов отклонений вычисляют выбо- 
рочные оценки дисперсий и лишь потом рассчитывают дисперсион- 
ное отношение непосредственно через Ол [X] и D, [X], вычислен- 
ные по формулам (6.2.7). При этом, естественно, величину Р-кри- 
тического следует определять по таблицам ЁР-распределения для 
того же числа степеней свободы, что и по Фишеру: для суммы 
дисперсий в Eere т — 1, a для знаменателя тп — т. Если 


Бо а. (Do [ХТ + под [X]) < Р-критического, TO 


влияние фактора А принимается несущественным *. Тогда в каче- 
стве оценки генеральной дисперсии вместо величины D, [X] 
можем принять общую дисперсию D [X], которая обусловлена 
только случайными o aa внутри- и между уровнями. 


По RAN (Do [X] + nD, [X]) > Е-критического, 


то следует отбросить гипотезу о несущественном влиянии фактора 
А и принять альтернативную гипотезу о существенном его влия- 
HAM. 

Пример 6.2.1. Применим ДА к результатам оценки трех мето- 
дов преподавания, различающихся только использованием на- 
глядного материала (пример 5.2.13, стр. 323). 

По данным, приведенным в табл. 5.2.12 (стр. 323), вычислим 
промежуточные переменные (в общем виде, показанные в HMK- 
ней части табл. 6.2.1), результаты приведены в табл. 6.2.4. 

По уравнениям (6.2.3) вычислим суммы квадратов отклонений. 
Далее проведем расчет сначала по методу Фишера. oarretan 
его представлены B табл. 6.2.5. 

Можно видеть, что при критическом значении Ё для числа 
степеней свободы 2 и 42 и для доверительной вероятности 0,01 


отношение 


Если значение 


ВЕ 1,15 > Ро. 01:2 / 42 WE 9,19, 


т.е. различие значимо. Гипотезу об одинаковой эффективности 
трех методов преподавания, отличающихся степенью использова- 
ния наглядных материалов, нужно отклонить и peu, противо- 
положную гипотезу. 


* Не следует забывать, что такой вывод' справедлив только для выборки - 

того объема (т Х п), который был изучен. При большем количестве испыта- 
` ний можем получить противоположный результат, и влияние фактора А 
придется оценить как существенное. 
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Таблица 6.2. 4 


Промежуточные данные для’ ‘однофакторного ДА к примеру 6.2.1 


Meron ; 2n Метод Е Г 
ть 3 
51= ri 65-165 216 У 5;= 579 
i=1 j=1 
15 3 
srao n 1853 2706 3242 >> у 2}, = 1801 
$=1 - j=1 1=1 
3 
57 27225 39204 | 46656 У, 51 =113 085 
j=1 
S2 | | Е 5 
aS 1815,0 | 2643,6 | 34104 > -j5 ~ 1539,0 
| 1=1 


Таблица’ 6.2.5 


Результаты однофакторного ДА по методу Фишера при одинаковом п 
для данных примера 6.2.1 


Суммы Средние 


д ки а y | Квадратов Зин емыЕ Значение 
вариативности отклоне- те отклоне- ея Е-критерия 
Между —уров- 15 -D4 [X]+ p 446 _ 
HAMH 89,2 2 44,6 +D [X] o 
Ba A | 2745 
нутри уров- 
Вы. 262.0 42 6,24 Do [X] 
Общая 351,2 44 -— — 


Теперь можем вычислить Da [X], которая, как оказалось, 
невлучайным образом отличается от а Согласно уравнениям 


(6.2.5), 


Da [X] = (44,6—6,24). -= = 2,56. 
Таким образом, можем записать основное уравнение ДА: 


где О. [Х] = 6,24; В.Е z и должно. быть. D [X] = 
+2, 56 — 8,8. 
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Вычислим р [Хх согласно уравнению (6.2. 5) и табл. 6.2.5, 


Hirr s an = 7,98. 


Можно видеть, что основное уравнение ДА при вычислениях 
по Фишеру не выполняется: D [X] < В, [X] + Da [X] .* 

Выполним теперь расчет дисперсий и дисперсионного отноше- 
ния по исправленному методу. Дисперсии будем определять по 
уравнениям (6.2.7) для тп — 1 = 44 степеней свободы. Резуль- 
таты приведены в табл. 6.2.6. Можно видеть, что основное урав- 
нение дисперсионного анализа выполняется: общая дисперсия 
в точности равна сумме факторной и остаточной дисперсий. 


Таблица 6.2.6 


Результаты однофакторного дисперсионного анализа по исправленному 
методу при одинаковом п для данных примера 6.2.1 


ое Qi mn—i D¿ [X] F 
Факторная | 89,2 44 2,03 K ; 
p | 4 о и nat 2,03 — 6,12 
Случайная | 262,0 44 5,95 a 
Общая 351.2 44 7,98 | м Fooi; 2/49 — 5,145, 


т.е. различие значимо 
Дисперсионное отношение определим по Фишеру: 
Do [X] +7D; [X] 


iii Го [Х] 


Как видно из табл. 6.2.6, при вычислении по исправленной- 
методике дисперсионное отношение меньше, чем при вычислении 
по методу Фишера (6,12 < 7,15). В данном примере значимое 
различие сохраняется. Но важно отметить, что при близких к кри- 
тическому значениях F методика Фишера может привести к отбра- 
сыванию верной нулевой гипотезы и к принятию ложной альтер- 
нативной гипотезы, т.е. вероятность ошибки второго рода больше, 
если расчет вести по Фишеру. 


6.2.2. Схема раечета при различном количестве 
повторных испытаний | 


При неодинаковом количестве повторных испытаний схема 


расчета несколько усложняется. Имеем план эксперимента: 
т 


т. У, Nj, где п; — объем выборки при том уровне фактора А. 
7=1 


* Не случайно в таблицах результатов ДА всегда отсутствуют значения 
общей дисперсии. 
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Результаты эксперимента табулируются, так же как и в преды-, 
дущем случае (табл. 6.2.1), но добавляется еще одна строка 
для значений n;. Несколько видоизменяются формулы (6.2.3) 
для расчета сумм APATO отклонений. Они теперь имеют вид: 


Се вы om: Aj 2 \ 
т а 2 4 
in (t — ) nE BSN У , 
]=1 i=1 j=1 i=1 j=1:i=1 
m ni o СА т s п, 2 
0. = У X (eu r= У У тг | 22| › [ (6-28) 
j=1 #=1 - [21 1=1 1=1 i=1 | | 
АН E m я п; 2 ‚т. N 2 
бл=п У (=>. til —-у A Zj] > 
j=1 j=1 ji 7 181.11 7) 
где 
т } 
]=1 
и (6.2.9) 
т 
j=1 | 


Если пользоваться методом Фишера, то в качестве оценивае- 
мых компонентов дисперсии имеем: 


Q 

SSi = №: |- РА 1х1 D. [X], 
=1 
ых 

п") = 0%] 
И | À 
Ta | 
y Do [X] DAI Da +, (6.2.10) 


\ j>: 


Для расчета дисперсий мы ниже будем пользоваться исправлен- 
ным методом, а дисперсионное отношение вычислять по Фишеру. 

Пример 6.2.2. Используем ДА для оценки влияния образова- 
тельного уровня (и возраста) школьников 6—11 классов на 
результаты по тесту «числовые ряды» (см. пример 5.2.12, стр. 324). 
Первичные ‘данные были приведены в табл. 5.2.140 (стр. 321). 
Промежуточные данные для расчета сумм квадратов отклонений, 
согласно уравнениям (6.2.8), приведены в табл. 6.2.7. Суммы 
квадратов отклонений, количество степеней свободы, дисперсии 
и дисперсионное отношение приведены в табл. 6.2.8. 

Для вычисления дисперсионного отношения используем фор- 
мулу (6.2.10). Расчет в табл. 6.2.8 показывает, что F a 20,56. 
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Таблица 6.2. 7 


_ Данные для расчета PEA квадратов отклонений по уравнениям (6.2.8) 
K npamepy 6.2. 2. | 


Классы | 
Компоненты сумм 
в уравнениях (6.2.8) 


6 | 7 | 8 9 | 10 | 11 
j 
Уз | 363.0 | 376,5 | 389,0 | 460,5 | 502,5 | 447,5 > а 
1=1 11=1 
nj -a e a aaa a O N =152 
j spacy 
> 2, 5100,5| 5933,2] 6048,0] 8650,8| 9874,8| 8807,8) У; J; 13, =44 385,1 
i=4 l j=i 1=1 — 
У ны 
г S 7 4880,3| 5670,4| 5820,0| 8482,4| 9711,8 8706,8| 2 =“ 
eT = 43 271,4 


| 
Таблица 6.2.8 


Результаты однофакторного дисперсионного‘ анализа (по исправленному 
методу) для неодинакового количества повторных испытаний 


Вариативность Q; №М—1 D; F 
| ны 
` 1 И. 
Факторная 860,1 151 5,70 ee № nj = 25,9 
`. | 9=1 
р. БА мы ХА 
| | ВЕК 
Случайная 1113,7 154 7,37 154 58 
TA == 20.56 


T. е. различие значимо 


Заметим, что вычисления по методу Фишера дают значение F = 
- = 22,5, весьма завышенное. 

Сравнение с Г*-критическим при доверительной вероят- 
ности Р = 0,99 и количестве степеней свободы для оцениваемых 
компонентов дисперсии (соответственно 9 и 146) показывает, что 
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различие значимо. Нулевая гипотеза должна быть отклонена, и 
следует принять гипотезу о существенном влиянии уровня обра- 
зования (и возраста) школьников 6—14 классов на оЗуТЬтАТЫ по 
тесту «числовые ряды». | 


$ 6.3. ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ 


Основное уравнение ДА при двух факторах А и В, влияющих, 
как предполагается априори, на средние значения изучаемой 
переменной X, в общем случае задается уравнением 


D [Х] = D4 [X] + Ds [X] + Das [Х] + D, [X], 


где Da [X] — компонент общей дисперсии (D [X]), обусловлен- 
ный парциальным влиянием фактора А; Dp [X] — компонент 
общей дисперсии, обусловленный парциальным влиянием фак- 
тора В; Dag [X] — компонент, обусловленный совместным BIMA- 
нием (взаимодействием) факторов А и В; D, [X] — остаточная 
дисперсия. Член Рав [X] удается определить лишь при наличии 
повторных испытаний. Но в ряде случаев практически важно по 
минимальному количеству наблюдений выявить, существенно ли 
общее и парциальное влияние двух факторов, без учета их взаимо- 
действия. Поэтому. сначала рассмотрим схему двухфакторного 
ДА, когда повторные наблюдения отсутствуют, затем изложим 
схему с повторными наблюдениями. 3 


6.3.1. Схема раечета при отсутетвии повторных испытаний 


При отсутствии повторных испытаний и произвольном коли- 
честве уровней каждого из двух факторов имеем схему испытаний 
t X g, где t — количество уровней фактора А и g — количество 
уровней фактора В. Соответственно имеются уровни А, (] =. 
Е .. ри уровни В, (1 = 1, 2, 3, <e -s g) — всего в 
испытаний. Причем, как показано в табл. 6.3. 1. для каждой пары 
A;B; имеется всего одно наблюдение 2, переменной X. 

Если влияние факторов существенно, то оно должно сказы- 
ваться на вариативности между столбцами, обусловленной факто- 
ром А, и на вариативности между строками, обусловленной фак- 
тором В. Поэтому для расчета факторных дисперсий необходимо 
определить суммы квадратов отклонений по столбцам и по стро- 
кам, кроме того, нужны соответствующие суммы для общей и 
остаточной дисперсий. Эти четыре суммы квадратов отклонений 
вычисляются по и формулам: 


(6.3.1) 


\2 | 


=. f 
DA DE 


j=l j=1 
„=$ S-S 6r- Ув 1 (У) 
i=1 j=1 i=1 : j=1 j=1 


где Q — общая сумма квадратов отклонений; Ол и га — суммы 
квадратов отклонений по факторам А и В; О, — остаточная сумма. 
Легко видеть, что выполняется равенство 


Q=Qa t QB +Q- | (6.3.2) 
_ Таблица 6.3.1 


Первичные данные для двухфакторного анализа без повторных . 


наблюдений 
Квад- 
Суммы по . раты 
А! Аз я А; реа - строкам сумм по 
строкам 
Bı Til | 112 E Tij a 21 Si (S1)? 
B2 T21 T22 ел 12] ее Lat 5 (55)? 
В; Til Ti 2 Tij Tit 57 (S4)? 
r ’ 
Bg Tgi |- Pga т] Tat S g (Sg)? 
a = 
Суммы =, 9] = 2 (51)? 
по 7=1 1=1 
столб- | 51 5? 5] Si g 
цам => Si 
— 
Квад- 
раты 
сумм 2 о 2 l 
по 5 53 5} S? +3 (S ;)? 
столб- 7—1 
цам 


Вычисление отдельных слагаемых, образующих суммы, не 
представляет затруднений. Отметим лишь, что на основе равен- 
ства T по столбцам и суммы по строкам (см. ых 6.3.1). 


член — Ae S Ия может быть заменен равным ему членом —— 1 (55 z 
$=1 

о, ‘Фишеру, в рассматриваемом случае резания следу- 

ющие степени свободы. Для факторных. дисперсий: по числу 


уровней фактора минус одна (t — 1) и (g — 1). Для остаточной 
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дисперсии — общее количество степеней свободы минус суммарное 
число уровней без единицы: tg — (g + t — 1) = (t — 1) (g — 1). 
Для общей — суммарное число степеней свободы без. одной: 
tg — 1. Легко видеть, что 


eA Zie ye Dte te 1). 


По методу а оцениваемые компоненты дисперсии вычис- 
ляются следующим образом: 


Qa ) 
| г = 80 [X1 +D, [X], | 
o =tDs [X] +D. [X], | (6.3.3) 
S A SE ы р. 

ее Е) 


На основе правых частей равенств (6.3.3) и соответствующего 
количества степеней свободы осуществляются вычисление и 
проверка дисперсионных отношений: 


о и 

> м (6.3.4) 
а: ЖЕ (e-1) = DBIA T Bad X: 

ет J Do [X] 


Пользуясь исправленным методом, будем вычислять дисперсии 
по уравнениям, аналогичным (6.2.7), а затем проверять F® по 


(6.3.4). 


Пример 6.3.1. В рассмотренном выше примере 6.2.1, оценивая 
влияние наглядности в преподавании тремя методами, мы не при- 
нимали во внимание такие существенные для успешного овладе- - 
ния материалом переменные, как прошлые успехи школьника 
в изучении предмета, его интерес к предмету и к учебе вообще 
и многое другое. При однофакторном ДА эффект этих перемен- 


= ных суммировался с эффектом метода преподавания и не мог 


быть выявлен. Но представляет интерес определить парциальные 
эффекты метода преподавания и, например, прошлой успевае- 
мости школьников по данному предмету. Чтобы это было воз- 
можным, необходимо упорядочить учеников (для каждого из 
трех методов преподавания), согласно их предыдущей успевае- 
мости. Пусть, например, первая тройка учеников (по одному 
на каждый из проверяемых методов преподавания) включает 
в себя наиболее успевавших в прошлом. Вторая тройка — успе- 
вавших чуть менее, третья — еще менее успевавших и т. д., 
наконец, последняя, пятнадцатая тройка — это наименее успе- 
вавшие ученики. 

Полученные таким путем тройки учеников представляют собой 
уровни нового для нашего примера фактора — фактора предыду- 
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щей успеваемости школьников. Таким образом, у нас теперь- 


рассматриваются два фактора. Первый фактор — назовем его 
А — это наглядность в преподавании; он имеет три уровня 
А, (j = 1, 2, t; t = 3). Второй фактор (обозначим его В) — это 
предыдущая успеваемость школьников; пусть он имеет по-преж- 
нему пятнадцать уровней В; (1 = 1,2, ..., 5; g = 15). 

Если в примере, рассматривавшемся выше, группы учеников 
для преподавания каждым из трех методов выбирались случайно, 
то теперь, на основании только что изложенной схемы, нужно 
учесть предыдущую успеваемость учеников. Это означает, что 


Таблица 6.3.2 


Исходные и промежуточные данные для двухфакторного ДА 
при отсутетвии повторных наблюдений 


Уровни Aj : | A 
А: д) А si) 
Bı 13 15 16 44 1936 
Во 15 13 17 45 2025 
Ba 12 14 15 41 1681 
Ва 14 15 16 45 2025 
B; 12. 14 1$. 41 1681 
Be 13 13 17 43 1849 
(2) В; 11 14 9 34 1156 
В: 13 12 ` 43 38 1444 ` 
E | Bo 11 12 15 38 1444 
В 12 14 Bo 39 1524 
Bıı 9 10 13 32 1024 
В12 11 14 14 39 1524 
Bis 10 9 D 28 784 
В1а ir, 14 30 900 
Вл 10 6 8 24 576 
57 473 184 oa foa [a мы | 204 N = 561 Š BS 
= 21 567 
р s 3 
S3 29 929 33 856 41 616 У (S;)2=105 401 
j=1 
15 3” №5 
2053 2354 > 2899. | & »2=17297 


{= 7=11=1. 
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_из числа пятнадцати. различных но успеваемости групи * необхо- 


димо случайным образом выбрать из каждой группы трех учени- 
ков соответственно трем методам преподавания. Далее с выборкой 
в 45 учеников проводится эксперимент, как указано в примере 
5.2.13 (стр. 323). 

Результаты эксперимента табулируют согласно табл. 6.3.1. 
Вычисляют сначала промежуточные значения для слагаемых 
сумм квадратов отклонений (уравнения 6.3.1), они представлены 
в нижней части табл. 6.3.2, а затем находят сами слагаемые и 


суммы Q,: 


1 2 5 2 
1 У 1 У z = 


j=1 1=1 7 
g ; 

= 2 (S;)? = 7189,0 = у ($)? = 7026,1. 
$=] j=1 


Суммы квадратов отклонений представлены в табл. 6.3.3. 
Там же показаны результаты ДА. Можно видеть, что влияние 
Тоблица 6.3.3 


Результаты двухфакторного ДА при отсутетвии повторных наблюдений 
(к примеру 6.3.1) 


р f = = >= 
g sE a o o a 
z E SHY B ВЕР 
z z Е 5 |] z S 5 5 к] z Дисперсионные отношения 
r: она а». SHa A 
в: 5 SOLR] F2 gom | 
E = m S'S SA Se S5 | 
AE ое Ра OR |3 
| х Р(А) _ 45.6. [М] Е Во [Хр _ 
По ġar- | Qa =70267— | 4, |РА[Х = z Do [X] z 
Topy А | 6993,8 = 32,9. — 0,748 758 
| 3- Dp[X]+Do [X] 
тору В |— 6993.8 =195,2| 44 | =4,436 ~< 897 
OaS 1297,0 — 
Остаточ- — 7189,0 — Da [X| = = (А) EA АЕ 
ная — 7026,0 +- z z р аа ыы F 0,99; 2/28 2 5,45 
- | + 6993,8 == 75,1 Е =. 2 
z Е > F 0,99; 14/287 2,8 
Gomar | O ID= Feir АЕ 
— 6993,8 = 303,2 = 6,89 Влияние A и В значимо 


* Успеваемость внутри группы должна быть примерно одинаковой. 
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обоих проверяемых факторов значимо, так как эмпирические 
дисперсионные отношения превосходят критические значения 
Е* при доверительной вероятности P = 0,99. - 


_ 6.3.2. Схема расчета при наличии повторных 
испытаний 


При наличии повторных испытаний и произвольном количе- 
стве уровней каждого из двух факторов имеется схема испыта- 
ний: $ X g п, где по-прежнему É — количество уровней одного 
из факторов (например А), g — количество уровней другого фак- 
тора (В); в — количество повторных наблюдений изучаемой пере- 
менной, одинаковое для сочетаний по два всех уровней факторов. 
Первичные данные в этом случае группируются в «блоки» по п 
значений т;„, соответствующих каждой паре A;B; уровней фак- 
торов А и В, как это показано в’ табл. 6.3.4; £ LN E E 

Значения 2;,„ изучаемой переменной X, сгруппированные 
в блоках, наблюдаются при одних и тех же (внутри каждого 
блока) уровнях обоих факторов. Поэтому их дисперсия, наряду 
со случайными флюктуациями, обусловлена совместным дейст-. 
вием факторов при каждой паре уровней. 

Чтобы выявить компонент дисперсии. Dap [X], обтьловленный 
совместным действием факторов, необходимо к четырем суммам 
Q; квадратов центральных отклонений добавить пятую сумму QAB, 
определяемую для блоков. При этом из-за введения дополнитель- 
ной переменной все формулы (6.3.1) несколько усложнятся: 


03 
S 
~ 
zs 
ре 
[> 
>” 


5 t n 2 Í = 2 
Е . Е. 
Qi = т Tijk ngt Tijk 
iì=1 \j=1 k=1 j=1 i=1 k=1 , 
t g n 2 t #_ т 2 
1 T 
Qa =e ni < Tijk] 
j=1 i=1 \А=1 j=1 \i=1 k=1 
ENa < e a 1655 
1 1 Е 
(УХУ Sen 
14=1`\7=1 k=1 j=1 i=1 k=1 , 
t g n 7 Í g n 2 
Уи 
j=1 i=1 k=1 j=1 i=1 \В=Т. , 
E E í ES A $ 2 
Ty 
eR 2 ; 
0 =) 2 >= (УХ Ули 
j=1 i=1 В=1 j=1 i=1 k=1 , 
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. где Оли Qg — суммы квадратов отклонений по факторам А и В; 
Qag — сумма квадратов отклонений для совместного действия 
факторов; Q, — для остаточной и О — для общей дисперсий. 
Можно видеть, что выполняется равенство 


Q-a ttg tO = (6.3.6) 


Сопоставление компонентов формул (6.3.5) с табл. 6.3.4. 
хорошо демонстрирует REAC POTAHY процедуру, которую ниже 
рассмотрим ‘на примере. _ 

Согласно Фишеру, число степеней свободы для Da [X] и 
Dg [X] остается прежним: (+ —1) и (g — 1) соответственно... 
Для вычисления остальных компонентов дисперсии количество 


Таблица 6.3.4 


Предетавление первичных данных для двухфакторного дисперсионного 
анализа с повторными наблюдениями 


Уровни фактора А 


В* 
А! | A2 | А, | y | А, 
1 2111 2121 1171 2141 
9. 
Е: 1112 1122 71] 2 Tit 2 
: Bı i : E м 
k Tilik T12k Tijk Titk 
a Tiin Tin Tijn Litn 
а 1 1211 T221 1271 721 
2 T212 T222 22]2 122 
с ее у Š 
B2 t 
> k T21k 722 T2jk 2tk 
© . . . i 
R . n Tln T22 Tajn Топ 
= j * 
[na] k ~. o . . 
= 1 Ti 11 Ti 21 2171 Titi 
= 2 Ti 12 Ti 22 Tij? Tit 2 
= А; e. ; 
m a k Tilk Ti 2k Tijk Titk 
© erta ь 
= n Ti in Li 2n Tijn Lin 
> "S . e Sa . 
1 Tg11 Tg 21 tgjı Sia 
2 Tg 12 Tg 22 Tgj2 Та? 
В e . . . . . . á . . . . . . bd s ° . . . 
j k Tg Ik Tg 2k l Tgjk Та 
no gın | gən Те тает 


* Е — номера повторных наблюдений. 
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степеней свободы — дается следующими формулами: для 
Плв[Х] (t — 1)(& — 1), для D, [X] (n — 1) tg и для DIX] tgn —1. 

По исправленной методике для всех дисперсий принимается 
одно и то же число степеней свободы: tgn — 1. Дисперсионные 
отношения для проверки значимости парциального и совместного 
действия факторов определяются по формулам: 


ne Di [Хх] 0 в[Х] +2, [1 } 


РА == D- [X] , 
Enel ВЕ l (6.3.7) 
-pap — #Pan XID, [X] 

T E EES J 


Пример 6.3.2.* Экспериментально исследовалось влияние двух 
факторов на успешность прохождения крысами лабиринта. Один 
из факторов — степень подвижности (активности) крысы, дру- 
гой — условия воспитания, в различной мере способствующие 
формированию активности животного. Было три уровня первого 
фактора, по которым все крысы подразделялись на три группы: 
подвижных (bright), уравновешенных (mixed) и вялых (dull), и два 
уровня второго фактора, по которым каждая из трех групп дели- 
лась на две подгруппы: воспитывавшихся в свободных (free) усло- 
виях и воспитывавшихся в стесненных (restricted) условиях. 
В каждую из подгрупп (блоков) входило восемь крыс. В табл. 6.3.5 
представлены результаты эксперимента **. 

`Для вычисления сумм квадратов центральных отклонений 
по формулам (6.3.5) требуется выполнить промежуточные рас- 
четы, результаты которых удобно табулировать, как сделано. 
в табл. 6.3.6. Далее каждая из 12 сумм в табл. 6.3.6 возводится 
в квадрат, а затем осуществляется суммирование: 

3 8 2 
pa У (> zija) = 2 137 469, 
-J=1 1=1 

3 


> 


7=1 


; 
3 


7=1 i=1 В=1 


ea) = 4015 617, 


2 
> 
i=1 

3 


T 
Mo 
8 


aJ- = 14 175 649. 


* Заимствован из KH.: G. A.Ferguson. Statistical Analysis in Psy- 
chology and Education. Second Ed. McGraw-Hill, Inc. 1966, p.347. 

** Фергюсон не указывает, что за переменная измерялась, но судя по 
данным в табл. 6:3.5, можно думать, что это какая-либо количественная 
характеристика успешности прохождения лабиринта. 
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Таблица 6.3.5 
Исходные данные к примеру 6.3.2 


Степень активности крысы (А р 


k ; 
А: — подвижные _ ие тент Аз — вялые 
1 26 41 36 
2 41 | 26 39 
Briag 28 19 59 
о |4 92 59 27 
Е Ро 14 82 87 
А о 
рав 16 86 99 
х = m 
|5 7 29 45 126 
5 8 31 37 104 
= 
=m 
5 
= 1 51 S: 42 
S 3 96 104 92 
eL Pa 97 30i; 156 
P> Е 4 22 122 144 
B| 5 35 114 133 
5 36 92 124 
о 7 28 87 68 
8 76 | 4—1 _ 442 


Таблица 6.3.6 


Промежуточные величины для расчета сумм квадратов 
2 по формулам (6.3.5) и табл. 6.3.5 — 


Суммы по строкам 


A2 | Аз 


n (=). (>). |=). | Gå- 


k=1 k=1 k= 1=18=1  /1 
=a] = 395 =T = 1249 
8 8 ‚ 8 378 
- |e) eh =) Bie- 
k=1 21 k=1 22 В=1 23 j=1 В=1. 2-9 
= 441 LT = 901 = 2094 
Зы /2 8 2 8 2 8 2:38 
nE (ÈS an) > (22 ан) = (> San) z (2 3, $, zin |= 
aS] US ksi /1 i=1 k=1 2 1=1 8-1  /3 i=1 j=1 k=1 
ЗЕ —=718 | = 1147 = 1478 = 3343 


EJE 


Таблица 6.3.7 


Результаты двухфакторного дисперсионного анализа с повторными 
наблюдениями по данным примера 6.3.2 


Суммы квадратов Число. Оцениваемая 
Вид вариативности роге й то: ovenereit дисперсия `Дисперсионные отношения 


$ 1 - 
FA) — (8.2.316,5- 8. 28,34 + 
По фактору А т Ou = 448558 47 D 4 [Х] = 346,50 907,82 
x -+ 907,82) ~ 6,83 
| 1 
F®) — 8.3. 386,17 --8. 28,34 + 
По фактору В Q p = 18150,04 4T Dp [X] = 386,17 907,82 Era 
-+ 907,82) ~ 11,46 
š NYO = 1334.04 4T Олв[Х]= 28,34 
y и АВ АВ | | p(B) 8: 28,34--907,82 _ 25 
907,82 
Остаточная _ Qo=42667,38 |. 47 Do [X] = 907,82 PN Pa oi eoi 
Общая _ Q = 77024,98 47 D [X] = 1638,83 и 


р(АВ) rA Fies: 24а — 8.22 


~ 


Кроме того, непосредственно по табл. 6.3.5 получают 


55 У zin = = 309 851. 


j=1 i=1 k=1 


Теперь остается лишь подставить значения сумм в формулы 
(6.3.5) и при t = 3, g = 2, п = 8 вычислить Q;. Все остальные 
расчеты тривиальны. Поэтому в табл. 6.3.7 приводятся лишь 
окончательные результаты дисперсионного анализа, выполнен- 
ного .по исправленной методике. 

Как показывает сравнение эмпирических значений дисперсион- 
ных отношений с их теоретическими значениями, парциальное 
действие обоих изучавшихся факторов существенно, но их взаимо- 
действие не существенно. Следовательно, можно в качестве более 
полной оценки случайных флюктуаций принять сумму 


DAID X1 DX] 93618: 


Отметим в заключение, что двухфакторный анализ с повтор- 
ными наблюдениями возможен и при неодинаковом количестве. 
дат в блоках. Схема расчетов для этого случая приведена в упомя- 
нутой книге Фергюсона. 


$ 6.4. ТРЕХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ 


Схема трехфакторного дисперсионного анализа похожа. на 
схему двухфакторного ДА с одинаковым количеством повторных 
наблюдений, только вместо них берется п уровней третьего фак- 
тора С,, где А = 1, 2, n. | 

Если при трех факторах отсутствуют повторные наблюдения, 
то нельзя определить взаимодействие АВС. Поэтому начнем рас- 
смотрение сразу со схемы трехфакторного эксперимента, в кото- 
ром при каждой комбинации факторов имеются повторные-наблю- 


дения. Итак, имеем три фактора: А; (j = 1, 2, ..., t), В; (i =1, 
а". В Ом (k = в ме nj. Кроме того, для каждой 
комбинации уровней АВС имеется l повторных наблюдений 
значений ет переменной X (т =1, 2,..., 1) — всего {91 
наблюдений. 


Пусть наблюдения сгруппированы поблочно (в ATEA l повтор- 
ных наблюдений) в черновых таблицах. Суммируя значения Хх; 


в каждом из блоков, определим суммы 5 А; ‚В.С,, которые запи- 
т=1 

шем в табл. 6.4.1.* Затем вычислим остальные ‘суммы для комби- 

наций факторов по два и для парциального действия факторов. 

Эти суммы для простоты обозначены и рассчитываются так, как 

показано в Табл. 6.4.1. 


* Индекс т в таблице опущен. 
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Суммы квадратов центральных отклонений вычисляются по 
‘следующим формулам: 


А-а (ХА) т eon’ | 
Е Ра ь 
= DIAG Же T 
вт D A DA Oa @ь—чиг 2m 
E O 
Qao = 2> ŞB) — Qs — Reir Doo’ 
Qasc=7 >>> [Аве С. — 9^—0в-— 0 —Олв- 


9 
— 


Tec 
— Qac — Qec— чт м 
=D I È È (tiem)? — Qa — Ов- Ос — Одв- Одес — 
TEW с а 
-Qne = Qaben иг Apa 


i ; eA 4 B 
Q == У b F > (тит) pay tgnl 2. 
Fay k 


(6.4.1) 


т Е : J 


Нетрудно видеть, что основное уравнение дисперсионного aHa- 
лиза в системе уравнений (6.4.1) выполняется: 


Q=Qa tr Fte tat Олс t Овс-- Одвс 0 (6.4.2) 


| 
Определяя соответствующие дисперсии, следует разделить 
равенство (6.4.2) почленно на общее число степеней свободы 
(1011 — 1). Источники вариативности, количества степеней CBO- 
боды и дисперсионные отношения в общем виде записаны в табл. 
6.4.2. Процедура расчета и проверки значимости компонент общей 
дисперсии аналогичны рассмотренным выше. 
Прежде чем перейти K примеру, сделаем два дополнительных 
замечания. 
1. Изложенная схема трехфакторного анализа с повторными 
наблюдениями без труда упрощается до схемы без повторных. 
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Таблица 6.4.1. 


Таблица первичных сумм для вычисления сумм квадратов 
центральных отклонений 


Ал A2 


У A1BıC2 


а А>2Ва Сл | >i A2B1C2 


У АаВ1С1 
У АаВ2С: | У А4В2С2 У A2B2C2 
| X AC | $ AC? X А.С: У А.С, 
р 
ЕР o 

У ABr | УАаВ2 | У AB | ŅA:B2 
a Ув:с: | УВ!С2 У вс: | $ B2C2 


| Примечание. 5 Aj= SA+’ A;C2; 6-Х AC + У, A20k; 
$ A;B: = È AjB:C1+ У AjB;C2; У B:Ck= У, A1B;Cr + УА»з Ве. Эти фор- 


мулы легко обобщаются на большее, чем 2, число уровней факторов. 


ST ААВЕС, 


M 
Г. 


УХобщ 


Общая сумма всех наблюдений 


наблюдений. В табл. 6.4.1 все > А,В;С, заменяются одним числом; 
в формулах (6.4.1) L = 1 можно опустить, а Олвс выпадает, так 
как ее нельзя выделить из Q,; выпадают значения [двс и FABO) 
в Табл. 6.4.2. 

2. Для упрощения расчетов дисперсионного комплекса в на- 
_ стоящее время стремятся применять линейные преобразования 
исходной переменной: 


Tiikm = aYijkm t b, 
T. е. переходят к новой переменной 


Tijk — 6 
Ут = F , 


перенося начало отсчета b и изменяя масштаб. Следует вспом- 
нить, что при этом значения Q; оказываются измененными в 4? раз 
(уменьшенными, если а >> 1, и увеличенными, если а <1), и это 
необходимо учитывать при окончательном расчете дисперсий D}. 
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- т. _Таблица 6.4.2 
Трехфакторный дисперсионный анализ с повторными наблюдениями = 


Источники Количество 


вариативности | = стененей свободы а Дисперсионные ОЕ 
м1 
FAR) АР 
А | t—1 Do z ны 
| - 1 
В ai 
В g—1 i Do $ 
x (in ВВ” Рав Dgo +z D aga t Оо) 
1 
C n= f Do a 
X (fg De +g Dac +tDga t? Dago t Do) 
Bie. | 
_ АВ (1—1) —1) = pr (Dast? Dago tDo) 
- A = 
AC (t—1) (n—1) FAO о (Dao t? Dago t Do) 
Eee 
BC (BAFRA) Ве Dge tl Dagat Во) . 
ABC (#—1) (2—1) (n—1) PABO i (I Рлвс- Do) 
o 
Случайные tgn (1—1) 
Итого 91 —1 


Примечание. Обозначения дисперсий сокращены: Da — вместо 
Da [X], Dag — вместо БВ [X] ит. п. 


Пример 6.4.1 *. Рассмотрим трехфакторную схему с повтор- 
ными наблюдениями переменной X, значения которой 2;;„„ пред- 
ставлены в табл. 6.4.3. 

Числа_в табл. 6.4.3 большие и содержат дробную часть. Io- 
этому осуществим линейное преобразование переменной, выбрав 
в качестве свободного члена ближайшее к’ математическому 
ожиданию целое число b = 28, а в качестве нормирующего MHO- 
жителя а = 0,5, чтобы избавиться от дробей: 


Улет = 2 (Ziikm = 28). 


Значения преобразованной переменной У приведены в табл. 6.4.4. 
Вычислим по этим данным все суммы, согласно табл. 6.4.1; 


* Заимствован из кн: Ч. Хикс. Основные принципы планирования 
эксперимента. «Мир», M., 1967. 
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Таблица: 6.4.8 
р Значения переменной Х для трехфакторного 
я r! диеперсионного анализа 


29,0 285. 28,0 29,5 
B 26,5 28,5 28,5 32,0 
1 30,5 30,0 28,0 29,0 
27,0. 32.5 25,0 28,0 
28,0 27,0 24.5 27,5 
Bə 25,0 29,0 25,0 28,0 
26,5 27,5 28,0 ` 27,0 

26.5 275 | 


26,0 26,0 


Q | Таблица 6.4.4 
Значения новой переменной у=2 (25—28) 


А! 71 А, 

С, С. С! | | С. 

g 1 о. 3 

—3 1 1 8 

Bı 5 4 0 2 
г —2 9 —6 0 
0 — —7 —1 

—6 2 —6 0 

B2 Я а 0 мт. 
—3 —1 —4 —4 


результаты приведены в табл. 6.4.5. Пользуясь табл. 6.4.5 и форму- 
лами (6.4.1), вычислим суммы квадратов центральных отклонений: 


Qa = -zy l3? + (—16) — 35 (— 13)? = 44,28, 


38)°] — z — 13} = 124,03, 


9в=5 3 4 

Qo =z [(— 32 +19] — -3 (— 18)? =81.28, 

Qas = 5 17+ (— 14)? +8? — (—24)"] — 14, 28 — 
— 124,03 — == (— 13)? = 0,03, 

Qac =r r [(— 10) + 13* + (—22) - 6*] — 11,28 — 
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— 81,28 — = (— 13)? = 0,78, 
Qio = yey I(— 38)? + 28? + (—29)2+ (—9)?] — 124,03 — 
1 
—81,28 — => (— 13) =3,78 
Qanc =} [2 +15? + (—5)? +13? + (—12)? + (—2)} + (—17)? + 
-- (—7)*] — 11,28 — 124,03 — 81,28 — 0, 03 — 0,78 — 
r ; ; 
—3,78 — => (— 13)? = 0,79. 
Qo, = 441 — 11,28 — 124,03 — 81,28 — 0,03 — 0,78 — 
—_ —3,78 —0,79— -z (— 13)? = 2413,75, — 


0—441— = (-=13)* =435,79. 


Таблаца 6.4.5 
Расчет первичных сумм для вычиеления О; к примеру 6.4. 1 


А! А» 
С: | C2 Cı | C2 
Bı 2 15 —5 13 25 


УА:с1=—10  |УА,:С:=13 |У А.С: =-22 X A2C2=6 


ХА = УА. =— 3; 

УС:=—32 = к ба b 

УАВ:=17 У Ав, =—14 | У A2B1=8 | У A2B2 = —24 A 
УХ BıCı=—3 | È BıC2=28 | УВ»: =— 29| У B2C2=— 9 


Рассчитаем дисперсионные отношения по схеме Фишера и 
по исправленному методу. Заметим, что для вычисления можно 
пользоваться суммами квадратов и дисперсиями случайной nepe- 
менной У. Результаты трехфакторного дисперсионного анализа 
данных рассматриваемого примера по схеме Фишера представлены 


_ B табл. 6.4.6. Можно видеть, что из семи нулевых гипотез, KOTO- 


рые состоят в допущении неслучайного влияния факторов А, 
Ви Св отдельности, по два и по три, приняты могут быть только 
две, а именно, относящиеся к факторам В и С. 
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| _ Таблица 6.4.6 
Результаты трехфакторного диеперсионного анализа по схеме Фишера 


Источник ей о; Средний Эмпирическое 
рано свободы. ` f повели Е да 
А 1 11,28 4428 1,26 
В 1 124,03 124,03. 13,92 
С HA 81,28 81,28 9,12 
AB 1 0,03 0,03 0,00 
АС 1 0,78 0,78 _ 0,09 
ВС 1 3,78 3,78 0,42 
АВС - 1 ET № 0,79 0,09. 
_ Случайные 24 213,75 8,91 = 
_ Итого 31 435,72 $95; 1/24 = 4,26 


— 0,99; 1/24 = 7,82 


Примечание. Подчеркнуты значимые на 99%-ном поноричельном. 
уровне дисперсионные отнощения. Напомним, что эмпирическое FÙ полу- 
чается как частное от деления {-того среднего квадрата отклонений 
на 8,91, соответствующее остаточной дисперсии. 


Так как вариативность, обусловленная источниками А, АВ, 
ВС, АС и АВС, должна рассматриваться как случайная, то ло- 
гично отнести эти источники вариативности в группу случайных 
прочих факторов. Для схемы Фишера это означает, что соответст- 
вующие суммы квадратов центральных отклонений Q; ‘должны 
быть включены в (Об: 


Qo=Qa t Qan + Qac т Овс- Олвс-- О. = 
= 11,28 + 0,03 + 0,78 +3,78 + 0,79 243,75 = 230,41. 


Новой сумме Qo, воплощающей B себе влияние случайных 
факторов, соответствует теперь и новое число степеней свободы: 
5 + 24 = 29. Поэтому и средний квадрат отклонений, выража- 
ющий по Фишеру оценку остаточной дисперсии, становится не- 
сколько меньше, чем прежде: 230,44 : 29 = 7,94. В нашем upa- 
мере это приводит к увеличению эмпирических дисперсионных 
отношений, и без того значимых, но в других случаях можно 
незначимое Ё «перевести» в значимое или, наоборот, т. e. 
изменить решение на противоположное. 

Результаты трехфакторного дисперсионного анализа, выпол- 
ненного с разложением дисперсий по В. А. Авилову, предста- 
влены в табл. 6.4.7. Можно видеть, что все эмпирические диспер- 
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7 т _ Таблица 6.4.7 


Результаты трехфакторного дисперсионного анализа с разложением 
дисперсии по В. А. Авилову 


носа м ай 9: | Djak Эмпирическое F(È) 

A 31 НЕ 0,364 1,23: 

'B 31 124,03 4,001 3,37 

C 31 81,28 2,609 2,57 

АВ 31 0,03 0,004 1,02 

AC | 31 0,78 0,026 1,02 

ВС <81 3,78 0,122 1,05 

ABC 31 0,79 0,026 1,02 

Случайные 31 21335. a 6,900 — 

Итого: 31 435,72 _ 14,055 F, 95; 1/24 =4,26 


Примечания: 1) о; — это дисперсии случайной переменной < 
Для исходной случайной величины Х дисперсии О; =а?.0,=0,250;; 


2) эмпирические дисперсионные отношения вычислялись по формулам, 
приведенным в табл. 6.4.2. > 


сионные отношения оказываются по величине меньше, чем Р-кри- 
тическое. Следовательно, для каждого из факторов и факторных 
взаимодействий исходная гипотеза о неслучайном влиянии фак- 
торов А, Ви С на переменную X должна быть отброшена и (при 
данном числе наблюдений) должна быть принята альтернативная 
гипотеза: парциальное влияние факторов и их взаимодействий 
не отличается от случайного. 

Остается проверить, отличается ли от случайного совокупное 
действие всех рассмотренных факторов и их взаимодействий? 
При такой постановке вопроса многофакторная схема сводится 
к однофакторной: 


[Хх] = Do IXFFDtXJ 


‘где D [X] — общая дисперсия, которая рассматривается как 
сумма только двух компонент: Оу [X] — факторной дисперсии, об- 
условленной действием всех изучаемых факторов, и D, [X] — 
остаточной дисперсии, обусловленной неконтролируемыми в 
опыте причинами. 

Очевидно, что факторная дисперсия — это сумма «парциаль-о 
ных» дисперсий факторов и их взаимодействий. В частности, 
для трехфакторного анализа: $ 


Do = Då + Dg + De + Dir + Dc + Dgc + Эльс. (6.4.2) 
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Число степеней свободы для Do определяется ов степеней 
свободы слагаемых в правой в уравнения (6. 4.2); оно соста- 
вляет tgn — 1 (см. табл. 6.4.2). 

Эмпирическое дисперсионное отношение здесь вычисляется 
как при однофакторном анализе: do. 


X- о (6.4.3) 
7 | 


Используя значения дисперсий D; из табл. 6.4.7, вычислим 
факторную дисперсию и Fp: 


0. = 0,364 + 4,001 + 2,609 0,004 + 0, 026 +0, 122+ 
+ 0,026 = 7,149. 


Проверка показывает, что с точностью до тысячных долей 
основное дисперсионное уравнение (6.1.1) выполняется. 


7. 7,149 -- 6,9 
E= 69 —= 8,25, 


что больше критического Р*о. 99; 7/24 = 6,07. Следовательно, мож- 


но принять, что совокупное действие рассмотренных факторов + на 
переменную X отличается от случайного. 


- 


Глава 7 


ОСНОВЫ МЕТОДОВ ФАКТОРНОГО АНАЛИЗА 


$ 7.1. ПОНЯТИЕ О МЕТОДАХ ФАКТОРНОГО АНАЛИЗА 
7.1.1. Сущноеть факторного анализа 


Явной переменной будем называть величину, которую можно 
непосредственно или косвенно измерить.* Например, можно непо- 
средственно измерить длину стола линейкой. Силу электрического 
тока можно косвенно измерить через посредство напряженности 
магнитного поля в проводнике. Длина стола, сила электрического 
тока — это явные переменные. Отметим, что при косвенных 


измерениях переменной X через переменную У должно быть 


1963). 


известно в явном виде уравнение X = f (У). 

Латентной переменной (фактором) будем называть величину, 
которую непосредственно измерить нельзя и для которой неизве- 
стны уравнения связи с какими-либо явными переменными. 

Большинство психических явлений, безусловно, должно рас- 
сматриваться как латентные переменные. Во многих случаях мы 
не знаем о них ничего, кроме того, что они существуют и, обусло- 
вливая жизнедеятельность, проявляются в действиях (реакциях) 
индивида. Эти действия представляют собой явные переменные, 
так как их можно объективно измерить, прямо или косвенно. 

Весом (зарядом, откликом) латентной переменной (фактора) 


у т-того индивида будем называть некоторую количественную 


меру проявления этой латентной переменной в наблюдаемых или 
специально вызываемых действиях (реакциях) данного индивида. 

Тестированием будем. называть естественное или специально 
сконструированное воздействие на психику,** вызывающее отклик 
латентного свойства F, который проявляется в объективно реги- 
стрируемом действии Z, где Z = ф (F), причем вид функции ф 
неизвестен. 

Задание, посредством которого осуществляется тестирование, 
называют тестом. Характер теста может быть любым — это и 
вопрос, ‘требующий ответа, и задача, требующая решения, и 


_ * В шкалах порядка и выше по С. С. Стивенсу («Математика, измерения 
и психофизика» в кн.: Экспериментальная психология, т. 1, «Мир», M., 


** Вообще — на живой организм или физический объект. 
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некоторая ситуация, требующая. определенного комплекса дей- 
ствий и т. п. Применение теста A; к Гтому индивиду вызывает 
у индивида реакцию Zj, которая как-либо оценивается или изме- 
ряется. Например, ответы испытуемых по тестам шкалы Векслера 
оцениваются суммами баллов. 

Зарядом (весом) латентной переменной (фактора) по ]-тому 
тесту будем называть количественную меру выявления данного 
фактора с помощью данного теста. 

Обычно психические явления на первичном уровне описания 
характеризуются группой свойств. Каждое из таких свойств — 
это латентная переменная. Свойства в группе могут быть соподчи- 
‚нены, могут различаться по степени общности. В этой связи и 
латентные переменные, отображающие группу свойств, образуют 
латентную структуру, в которой отдельные переменные могут 
в определенном отношении рассматриваться как общие, групповые 
и специфические. Кроме того, переменные в латентной структуре 
‚могут быть взаимосвязаны. 

Итак, латентной структурой будем называть систему латент- 
ных переменных, характеризующих некоторое психическое явле- 
ние и обусловливающих систему реакций индивида в ответ на 
систему внешних воздействий. Иначе говоря, латентная струк- 
тура обусловливает определенное поведение в основных условиях. 

Очевидно, уже по определению латентная структура должна 
рассматриваться в качестве структуры случайной как по харак- 
теру существования и выраженности ее элементов у различных 
‚индивидов, так и по степени возможности ее тестирования и 
описания. В этой связи факторный анализ как группа методов, 
направленных к выявлению и описанию латентной структуры, 
базируется на следующих основных постулатах. 

Постулат 1. Существование латентной структуры полностью 
определимо только на множестве индивидуумов, образующих 
генеральную совокупность. Следствие: латентная структура от- 
дельного индивида есть случайная реализация общей латентной 
структуры. 

Постулат 2. Латентная структура может проявиться лишь 
через определенное множество тестирований. Следствие: латент- 
ная структура, выявляемая через неопределенное множество тести- 
рований, есть случайная реализация общей латентной структуры. 

Рассмотрим основные уравнения факторного анализа. Пусть 
имеется множество индивидов B;, где i = 1, 2,3,..., п, и MHO- 
жество тестов * А‚, где j = 1, 2, 3, ..., т, причем каждый тест 
однократно применяется к каждому индивиду, в результате чего 
получается количественная оценка Z;;, см. табл. 7.1.1. Пусть, 
далее, латентная структура представлена множеством общих 
факторов F, где у = 1, 2, 3,..., 


* Множество тестов, определенное для выявления латентной структуры, 
обычно называют ‘батареей тестов. 
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Таблица 7.1.1 
Результаты применения батареи тестов к выборке испытуемых 


Множество индивидов В; 


В, | В. | Вз о} 5% | В; | e o o | Ba 
= Ал 211 212 213 211 : 21п 
= А? 221 222 223 . Z2i . Zən 
= 
i Аз 231 232 233 23 Zgn 
© ` . e 
m — 

2- m 

= о e e (3 e ^ e > e . . . ® 

о = 

я 5 Ат Зтл 5712 Zm3 Zmi . 2тп 


Тогда первое основное уравнение ФА может быть записано 
следующим образом: 


= a; (F) 6; (Fp); (7.1.1) 
 — оценка, полученная в результате однократного приме- 
нения ]-того теста к -TOMY индивиду; а; (Р,) — заряд у-того фак- 
тора в ]-том тесте; 6, (Р,) — вес у-ового фактора у 1-того индивида. 
Величины 2), а; (F) и b; (F) — это обычно величины, центриро- 
ванные и нормированные своими стандартными отклонениями *. 

Второе основное уравнение ФА может быть представлено в не- 
скольких вариантах (см. стр. 379—381). Например, оценки 2; 
в табл. 7.1.1 можно коррелировать по строкам или по столбцам. 

Если, используя коэффициент корреляции Пирсона,** опреде- 
лить, как коррелируют оценки Zj; каждого теста с каждым Apy- 
гим (коэффициент корреляции вычисляется между строками 
табл. 7.1.1), то второе основное уравнение ФА для каждой пары 
тестов имеет вид: 


где Z; 


Е 


r= (А. А,) = У а (Руза, (Ру), 1:9) 


y=i 


т.е. коэффициент корреляции каждого теста с каждым другим 
тестом рассматривается как скалярное произведение факторных 
зарядов соответствующей пары тестов. 


+ На практике чаще всего Zj; пе центрируются и не нормируются, фак- 
торные заряды и веса получают в виде основных отклонений в ходе вычисле- 
НИЙ. 

** Существо ФА обычно демонстрируют для коэффициента Пирсона, 
но факторный анализ можно осуществлять и на основе коэффициентов ран- 
говой корреляции, функционально связанных с пирсоновским. 
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Аналогично, коррелируя тестовые оценки каждого индивида 


с каждым другим (корреляция между столбцами табл. 7.1.1), 


имеем второе основное ее ФА для paani пары индивидов: 


ВВ : 5. (F,) b, (F,)- = (7.4.3) 


Необходимо отметить, что уравнение (7.1.2) справедливо 
только при условии выполнения постулата 1, а уравнение (7.1.3) — 
только при выполнении постулата 2. 
~ Из уравнения (7.1.2)* следует, что коэффициент корреляции 
]-того теста с самим собой — это величина, равная сумме квадра- 
TOB тоны зарядов данного теста: 


г—(А ^)-$ a? (F,). ~> (7.4.4) 


Величину r (4;A;) называют Peer или запасом общей 
изменчивости, она представляет собой часть общей дисперсии 
оценки 2, по ]-тому тесту. | 

Полное уравнение дисперсии в нормированном виде может 
быть представлено в виде суммы следующих компонентов: 


1 =г(А,А,) +e (F) + e}, a ALLS) 


где r (А, ‚А;) — запас общей изменчивости; Cj (F) — заряд фак- 
тора, специфического для ]-той переменной; €} — остаточная 


‚дисперсия оценки Ziji по ]-тому тесту. я 


Уравнение (7.1.5) — это третье основное уравнение факторного 
анализа. 
Обозначая г=(А,А;) = и 6(Р)+8=и), можем пере- 
писать уравнение (7.1.5): 
h} и} =1. (7.1.6) 


В факторном анализе существенную роль имеет величина hå, 
которая в подавляющем большинстве случаев априори неизвестна 
и с трудом может быть определена экспериментально.** Величина 
и}, в сущности, не имеет в ФА какого-либо значения, кроме того, 
что по ней определяется окончание процесса извлечения факто- 
ров. Тем не менее, на практике ее компонент #7 всегда присутст- 
вует, и его следовало бы суммировать с уравнениями (7.1.2) 
и (1.1.3): 

k 


r (AA) = > а; (Ру) a2 (Fy) -F E182, (7.1.7) 


* Так как уравнения (7.1.2) и (7.1.3) оно идентичны, далее в этом 
пункте существо ФА будем рассматривать на основе (7.1.2). 

** Коэффициент корреляций теста с самим собой известен под именем 
когффициента эквивалентности в случае, если два эквивалентных теста 
применяются одновременно к одной и той же группе людей, или под именем 
коэффициента стабильности, когда один и тот же тест применяется к двум 
эквивалентным группам индивидов. 
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где 12, — остаточный коэффициент корреляции, обусловленный 
а условий Ев 


r BB)=} (АЕ) Ев, ° о (148) 


где 8.8. — остаток, ое флуктуациями внутренней 
среды организма. 

На основании левых частей уравнений (7.1.5) и (7.1.7) может 
быть написана матрица коэффициентов корреляции,* в которой 
по главной диагонали записаны единицы. Такая корреляционная 
матрица называется в ФА «комплектной». Корреляционная мат- 
рица, у которой по главной диагонали расположены запасы общей 
изменчивости (по 7.1.4), называется «сокращенной». Пример 
комплектной и сокращенной ее РК ‘приведен 


в табл. 7.1.2. 
Таблица 7.1.2 


Комплектная и сокращенная корреляционные матрицы. 


Комплектная 
Е 712 T13 714 РБ 
721 1 r23 r24 T25 
r31 T32 1 T34 735 
741 742 T43 1 T45 
—751 r52 753 754 Е 
Сокращенная 
=. 712 ri; та A ER 
r21 h3 T23 T24 r25 
r31 732 h3 T34 735 
T41 T42 r43 h3 T45 
а T53 T54 hi-o 


Факторная (латентная) CTPYKTYPpa, выявляемая по множеству 
переменных (тестов или индивидов), может быть представлена. 
в виде матрицы факторных зарядов,** в которой по строкам ука- 
заны переменные (тесты или люди), а по столбцам — факторы 
(табл. 7.1.3). Строка факторной матрицы представляет факторную 
структуру переменной, столбец — структуру переменных, изме- 
ряющих данный фактор. 

Как указывалось, факторы в латентной структуре могут быть 
общими, групповыми и специфическими. Чаще всего в ФА рас- 
сматриваются латентные структуры, имеющие в своем составе 


* В дальнейшем, для краткости, просто корреляционная матрица. 
** Сокращенно: факторная матрица. 


377 


Таблица 7.1.8 
Комплектная и сокращенные факторные матрицы 


_ Общие факторы F, Специфические факторы С, 
1 | 2 3 1 2 3 4 | 5 
+: -fagy a12 a13 c11 
Sw р 
< 2 a21 a22 a23 C22 
Е 3 a31 a32 @33 C38 
> 4 a41 @42 a43 c44 
5 @51 a52 _@53 655 
Сокращенная—————— — Сокращенная 
Комплектная | 


только общие и специфические факторы *. Факторная матрица, 
включающая как общие, так и специфические факторы, тоже 
называется комплектной. Соответственно матрица, включающая 
только общие или только специфические факторы, называется 
сокращенной. Пример комплектной и сокращенной факторных 
матриц приведен в табл. 7.1.3. Отметим, что матрица специфи- 
ческих факторов — это диагональная матрица. 

Обобщая второе и третье основные уравнения (1.1.2) и (7.1.5), 
можем записать общее основное уравнение факторного анализа 
в матричной форме: 


R 
№ =à R, +0+E при (7.4.9) 
В, =Е,Бу. га 


Здесь В, — исходная, обычно комплектная корреляционная мат- 
panga, получаемая эмпирически; у — порядковый номер шага ФА, 
у =1,2,..., k, где Ё — количество общих факторов B латентной 
структуре и одновременно — число шагов по извлечению факторов;** 

В, — так называемая у-овая (первая, вторая ит. д. а 
ная матрица, получаемая в результате у-ового шага ФА; Е, — 
сокращенная факторная матрица, полученная в результате y- 
ового шага и содержащая один у-овый столбец факторных 
зарядов; Fy — транспозиция матрицы Е,, содержащая одну строку, 


* При этом общие факторы в дальнейшем специальными методами 
(ротации) «расщепляют» до групповых. 

** На каждом шаге извлекается один фактор, поэтому количество фак- 
торов и число шагов одинаковы. 
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С — диагональная матрица специфических. arepo; Е — матрица 
ошибок. 

Сущность любого из методов факторного анализа состоит 
в том, чтобы, преобразуя последовательно шаг за шагом исходную 
корреляционную матрицу Rọ, выделить из нее сокращенную 
факторную матрицу Е,, такую, чтобы выполнялось равенство * 


В, =F; РА E, (7.1.40) 


где в матрице Е все элементы E; не отличались бы статистически 
значимо от нуля. 


7.1.2. Разновидноети методов факторного анализа 


`Методы ФА можно классифицировать по крайней мере по трем 
основаниям: по направленности, по исходным представлениям 
о числе общих факторов, по исходным представлениям об а 
нальности факторов. 

Направленность ФА связана с объектом, в котором исследуется 
латентная структура, и с условиями, при которых она изучается. 
В качестве объекта ФА могут выступать множество тестов, мно- 
жество индивидов, множество случаев. Эти три переменных 
в сочетаниях по две (табл. 7.1.4) и по две перестановки в каждом 
‚сочетании (табл. 7.1.5) образуют шесть видов («техник») ФА. 
Рассмотрим подробнее, в чем суть шести вариантов ФА, так как 
это методологически и методически очень существенно. 


Таблица 7.1.4 
Сочетания переменных и виды ФА 


` Индивиды | Случаи 


Виды Тесты. 

Ти П т n 4 
IHI n IV m 1 

У и [У - 1 т 


Примечание. ти п— не единичные множества. 


I вид ФА в сущности «калибрует» батарею тестов на репрезен- 
тативной выборке индивидов. При этом обычно требуется вы- 
полнять условие: т K п — число тестов гораздо меньше числа. 
индивидов. Здесь попарно коррелируются тестовые оценки, полу- 
ченные усреднением по выборке людей, и выявляется матрица. 
факторных зарядов по тестам. 


* Это равенство часто и называют в нашей литературе основным уравне- 
нием ФА. 
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- Таблица 7.1.5 
Направленность видов ФА о 


Тесты 


Индивиды Случаи 
Тесты == Я Ш 
Индивиды == E У 
Случаи IV УТ — 


Примечание. Таблица, как любая матрица, читает- 
ся, начиная со строки. По строкам расположены перемен- 
ные, выступающие в качестве объекта исследования; по 
столбцам — переменные, опосредствующие изучение объектов. 


ПП вид ФА направлен к изучению выборки индивидов, не обяза- 
тельно репрезентативной, но обязательно с помощью представи- 
тельной батареи тестов. При этом обычно требуется, чтобы число 
индивидов было меньше числа тестов: т >> п. Но это требование 
далеко не всегда легко, а главное целесообразно выполнять, так. 
как часто возникает необходимость изучить для большой группы 
людей ограниченный круг свойств, тестируемых, естественно, 
ограниченным набором тестов. Здесь попарно коррелируются 
индивидуальные оценки, усредненные по множеству тестов, и 
выявляется матрица факторных весов по индивидам. 

Еще раз подчеркнем различие между Ги П видами, которые 
наиболее распространены на практике. Если I вид ФА отвечает 
на вопрос о том, как хорошо каждый тест (и батарея тестов в 
целом) выявляет некоторую латентную структуру. то П вид ФА 
отвечает на вопрос о том, в какой мере переменные латентной 

структуры выявляются у данного индивида. 

_ Считается, что если ФА выполняется на одном и том же 
массиве данных (см. табл. 7.1.1), то Ти П виды ФА приводят 
примерно к одной и той же факторной матрице. Различие остается 
лишь в интерпретации, согласно указанной специфике этих 
видов ФА. В этой связи отметим, что и между остальными парами 
видов (ПТ и IV, У и VI) отношения формально такие же. Поэтому 
иногда четные виды называют «обратными» в отношении их нечет- 
ной пары. 

III u IV виды ФА осуществляются на одном индивидууме. 
Если Ш вид ФА отвечает на вопрос, какова стабильность каждого. 
теста (и батареи в целом) при многократном применении к одному 
и тому же индивиду, то IV вид ФА отвечает на вопрос, какова 
роль повторений в выполнении индивидом каждого теста. Здесь 
вообще посредством факторных матриц исследуется как бы ДиНа-. 
‚мика тестовых оценок (ITI вид ФА), либо изменчивость латентной 
структуры индивида на множество случаев (ТУ вид ФА). Оба эти 
вида имеют большое значение для дифференциальной психологии. 
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К сожалению, их применение наталкивается на значительные 
трудности в связи с тем, что большинство современных тестов 
не допускает (из-за простоты) повторных, тем более мар 
применений к одному и тому же человеку. 

У и VI виды ФА осуществляются на одном тесте, многократно 

применяемом ко множеству индивидов. При этом вскрывается 
либо динамика латентной структуры от случая к случаю (У вид 
ФА), либо роль случая (повторения) в изменчивости латентной 
структуры у множества индивидов (VI вид ФА). Хотя эти два вида 
ФА. почти не используются, сам методологический подход тривиа- 
лен для психологических наук, в которых повсеместно осущест- 
вляется в эксперименте многократное применение одного и того же 
задания ко множеству испытуемых. 
_ По исходным представлениям о количестве общих факторов 
в корреляционной матрице В, исторически выделились три вида 
ФА: однофакторный (по т бифакторный saa Холзин- 
геру), мультифакторный (по Терстону). 

В настоящее время считается доказанным, что полная матрица 
интеркорреляций порядка т может быть факторизована бесчислен- 
ным количеством способов с выделением (теоретически) не менее т 
факторов. Несмотря на это, во многих случаях оказывается выгод- 
ным использовать более простые одно- и бифакторные модели ФА, 
дающие сходные с мультифакторным анализом результаты. Ниже 
мы подробно рассмотрим однофакторный и мультифакторный 
методы. * 

С точки зрения исходных представлений об ортогональности 
факторов выделяются два вида ФА: с ортогональными (независи- 
мыми) факторами и с облическими (зависимыми) факторами. 
Это, в сущности, разновидности мультифакторного анализа. Их 
специфику мы рассмотрим в дальнейшем. 


7.1.3. Задачи факторного анализа в пеихологии 


Обычно выделяют две основные: задачи ФА в психологических 
исследованиях. Во-первых, вскрыть латентную структуру и, во-вто- 
рых, вскрыть ее так, чтобы она описывалась небольшим числом 
переменных по сравнению с исходным количеством измеряемых 
переменных. Но в аспекте шести рассмотренных видов ФА, раз- 
личающихся направленностью, можно сформулировать задачи 
более конкретно, как мы это и сделали. Повторим здесь еще раз. 
три из них, основные, по современным возможностям. 

т. Определить степень пригодности батареи тестов для выявле- 
ния некоторой латентной структуры и шкалировать эту батарею. 

2. Определить выраженность некоторой латентной структуры 
у каждого индивида из выборки. индивидов. 


* За недостатком места бифакторная модель Холзингера не будет рас- 
сматриваться. 
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3. Определить динамические особенности некоторой латентной 
структуры на основе многократного повторного тестирования 
одного индивида либо многократного ‘применения одного теста 
ко множеству индивидов. | 5 | 

Решение этих задач является актуальным в настоящее время 
во всех отраслях психологии. 


$ 7.2. ОДНОФАКТОРНЫЙ АНАЛИЗ 


Метод однофакторного анализа предложен Спирменом в ходе 
обоснования «теории двух факторов» — общего (генерального) 
и единичного. Комплектная матрица факторов, по Спирмену, 
представлена в табл. 7.2.1. 

Таблица 7.2.1 


Однофакторная модель по Спирмену 


Факторы 
Показатели 
: общий. единичные 
Пе боже же нео EEE ET СО леев дек ны АА ВЕ ды Де Е ева Аа Дне Оз нуле Данон доче звание че ентот трения тибя 
1 а1 C1 
2 ао со 
3 a3 C3 
n an cn 


4 


Из табл. 7.2.1. следует, что все показатели (тесты, люди ит. д.) 
имеют отличающиеся от нуля заряды общего фактора (отсюда 
и название «общий») и, кроме того, — по одному специфическому 

_ фактору. 
° Процедура извлечения факторных зарядов (факторизации) 
по методу Спирмена относится лишь к общему фактору и состоит 
из трех этапов. На первом этапе для каждой ]-той переменной 
вычисляются заряды а, общего фактора по следующей формуле: 

7—7); 
(r) —2 (r); ° 


где (г), — сумма всех коэффициентов корреляции в ]-том столбце 
сокращенной корреляционной матрицы (элементы главной диаго- 
HAJM считаются неизвестными и не входят в суммы); (г)} — квад- 
рат предыдущей суммы; (r?°); — сумма квадратов всех коэффи- 
циентов корреляции в ]-том столбце сокращенной корреляцион- 
ной матрицы; (г), — сумма всех коэффициентов корреляции 
в сокращенной корреляционной матрице. 
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(7.2.1) 


“= 


` Определенные таким путем факторные заряды а) образуют 
сокращенную факторную матрицу Е, в которой всего один столбец 
и п строк (по числу переменных: j =1,2,..., n). 

На втором этапе ФА по методу Спирмена осуществляется 
транспонирование факторной матрицы-столбца. Транспониро- 
ванная матрица Е’ содержит одну строку с п столбцами. Далее, _ 
согласно уравнению (7.1.9), определяется «репродуцированная» 
сокращенная корреляционная матрица 


ВЕ: Е, 
каждый элемент которой определяется по формуле 

Tik = Qj * Aps _ (7.2.2) 
где гв — репродуцированный коэффициент корреляции; а, — 
факторный заряд ]-той переменной, а, — факторный заряд 
zkion нербменной. (= ва. ще 


Третий `этап процедуры состоит в определении «остаточной» 
корреляционной матрицы и проверки возможности рассматривать 
остаточную матрицу как матрицу погрешностей. 

Остаточная корреляционная матрица определяется как раз- 
ность между исходной и репродуцированной корреляционными 
матрицами: | 


вв В. (7.2.3) 


где В. — исходная, В, — репродуцированная, В, — остаточная 
корреляционные матрицы. Обозначив элементы остаточной мат- 
рицы гр», напомним, что они находятся для каждой пары эле- 
ментов Гр И Tjk по ураввони 


— 


Tik =T jk Га. (1.2.4). 


Далее требуется осуществить проверку равенства 
В = №: (7.2.5) 


где Е — матрица погрешностей. При проверке обычно исходят 
из того, что в остаточной матрице, если она действительно обра- 
зована погрешностями, остаточные коэффициенты корреляции 
Tik распределены нормально со средним значением, равным нулю. 
Следовательно, достаточно определить стандартное отклонение O, 
и проверить, как велика вероятность того, что максимальное 
значение остаточного коэффициента корреляции не превзойдет 
выбранной заранее величины #/у-0,: 


P ([7дь [пах < в" 0) =? (7.2.6) 


Здесь Ir; k |max — Максимальный (по модулю) из остаточных коэф- 
фыициентов корреляции; #/, — квантиль распределения Стью- 
дента, при заданной вероятности ошибки первого рода (q) и 
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_ данном числе степеней свободы (v). Если вероятность (7.2.6) доста- 
точно велика, то отличие |Tkj |max ОТ нуля можно рассматривать 


как случайное и, следовательно, для всех |гь| < [Гл [шах ЭТО 
тем более справедливо. Тогда можно принять, что (7.2.5) выпол- 
няется и остаточную матрицу можно считать образованной по- 
грешностями измерения. | ; 

Практически значение toj/y в случае ФА принимают равным 
единице. Тогда, учитывая, что для нормально распределенной 
переменной Х 


P (|X |= ох) 20,683 (см. стр. 135), 


ограничиваются проверкой условия. 


Ра т 


Если оно выполняется, то остаточную матрицу считают за мат- 
рицу погрешностей; если же’оно не выполняется, то значит в OCTA- 
точной матрице, наряду с погрешностями, содержатся заряды 
других общих факторов (по крайней мере одного), которые можно 
извлечь другими методами факторного анализа. 

Величину O, можно определить двумя способами. Первый 
основан на уравнении — 


Е 
а (7.2.8) 


Здесь М, — математическое ожидание величины коэффициентов 
корреляции в исходной корреляционной матрице (В,): 


где (г): определено выше как сумма всех коэффициентов кор. 
реляции в сокращенной корреляционной матрице; п — число 
переменных; n(n — 1) — число коэффициентов корреляции в CO- 
кращенной корреляционной матрице; Л — количество испытуе- 
мых (в общем случае — число пар коррелируемых значений). 
Второй ‘способ основывается на более простой формуле 


Е (7.2.9). 


tams 


r 


где N означает то же самое. O, по уравнению (7.2.9) получается 
примерно на 20% меньше, чем по уравнению (7.2.8). Следовательно, 
второй способ накладывает более жесткие ограничения на воз- 
можность выполниться неравенству (7.2.7), а также является 
более ‚простым с вычислительной стороны, поэтому его следует 
предпочесть первому. 

Рассмотрим теперь процедуру однофакторного анализа, по 
Спирмену, на примере. 
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Таблица I 


Исходная корреляционная матрица, промежуточные и окончательные _ 
данные факторизации к примеру 7.2.1 


Показатели 4 2 a 4 5 - 6 
1 — 0,48 0,24 0,33 0,38 0,43 
2 0,48 . — 0.57 0,56 0,43 0,59 
3 0,24 0,57 — 0,37 0,40 0,56 
4 0,33 0,56 0,37 — 0,49 0,50 
5 0,38 0,43 0,40 0,49 —_ 0,61 
6 0,43 0,59 0,56 0,50 0,61 — 
| 
r)i za j g h = 
(r); 1,86 2,63 2,14 2,25 2,31 (),=13 88 
(r)? 3,460 6,947 4,580 5,062 5,336 7,236 
(r2); _ 0,726 1,402 0,993 1,050 1,102 1,469 . 
Числитель 2,734 а а: 4,012 4,234 5,767 
(2r); 3,72. 5,26 4,28 4,50 4,62 5,38 
Знаменатель | 10,16 8,62 9,60 9,38 9,26 8,50 
a? 0,269 0,640 0,374 0,428 GATS: 0,678 
а} 0,52 0,80 0,64 0,65. | 0,68 0,82 


Пример 7.2.1.* В исследовании индивидуальных различий 
при запоминании разных видов материала изучались следующие 
шесть видов заучиваемого материала: 1) картинки, 2) слова 
K KT- 
оне Рабле 723 
5) Е трехзначные, 6) a Сокращенная факторная ани 

, к примеру 7.2.1 . 
смысленные слоги. Оценкой слу- 


жило количество повторений, Заряды общего 


потребовавшихся для полного Sei фактора 
запоминания. 

Ряды оценок, полученных j 055 
для 32 испытуемых, коррели- 2 0.80 
ровались для каждой пары 3 0,64 
видов заучиваемого материала. 4 0,65 
Сокращенная корреляционная. г р 


матрица порядка 6 представ- 
лена в верхней части таб- 
лицы 7.2.2. В нижней части | | 
таблицы представлены промежуточные и окончательные данные, 
соответствующие формуле (7.2.1). 

Сокращенная факторная матрица F представлена в табл. 7.2.3. 
Умножая, согласно (7.2.2.), матрицу Е на ее транспозицию Г’, 


* Заимствован из работы Б. М. Теплова «Простейшие способы факторного 
анализа» (в сб.: «Типологические особенности высшей нервной деятельности 
человека», т. У. «Просвещение», М., 1967). 


25 Г. В. Суходольский а. 


получаем репродуцированную матрицу R, она представлена 
B табл. 7.2.4. Далее, вычитая, согласно (7.2.3) и (7.2.4), матрицу 
В, из исходной корреляционной матрицы А’, получаем остаточ- 


` Таблица 7.2.4 


Репродуцированная корреляционная матрица, вычиеленная как 
произведение табл. 7.2 2.3 на ее транепозицию 


Показатели 1 A | 3 4 5 6 
1 — 0,42 0,32 0,34 0,35 0,43 
2 0,42 pi 0,49 0,52 0,54 0,66 
ð 0,32 0,49 — 0,40 0,42 0,50 
4 0,34 0,52 0,40 — 0,44 0,58 
я 0,35 0,54 0,42 0,44 — ; 0 96 
6 0,43 0,66 0,50 0,53 0,56 


| 


ную матрицу Rə, приведенную в табл. 7.2.5.. Выполним для этой 
матрицы проверку условия (7.2.5). С этой целью двумя способами — 

по (7.2.8) и (7.2.9) вычислим о,. 
Таблица 7.2.5 


Остаточная корреляционная матрица 
(получена вычитанием из матрицы 7.2.2. матрицы 7.2.4.) 


Показатели 1 2 5 6 
1 — 0,06 — 0,08 — 0,01 0,03 0,00 
2 0,06 0,08 0,04 — 0,11 — 0,07 
3 — 0,08 0,08 — 0,03 — 0,02 0,06 
4 — 0,01 0,04 — 0,03 — 0,05 — 0,03 
5 0,03 —0,11 — 0,02 0,05 —- 0,05 
6 0,00 — 0,07 0,06 — 0,03 0,05 — 


Сначала определим оценку математического ожидания М), 
для исходной корреляционной матрицы: 


ом, = Da —0.46. 


ив уе _ 0,2. 


Максимальное ‘абсолютное значение остаточного коэффициента о 
корреляции из табл. 7.2.5 составляет 0,11. Следовательно, усло-. 


Тогда 


вие (7.2.5) выполняется. По второму способу o, = SF zæ 0,18, 
и ycoBne (7.2.5) тоже выполняется. Тем более все другие остаточ- 
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ные коэффициенты корреляции в табл. 7.2.5 удовлетворяют 
этому условию. Следовательно, мы можем считать остаточную 
корреляционную матрицу матрицей погрешностей, а процесс 
факторизации законченным. 

Итак, выделен единственный общий фактор, интерпретируемый 
как «фактор опосредствованного, осмысленного запоминания». 


$ 7.3. МУЛЬТИФАКТОРНЫЙ АНАЛИЗ 


Мультифакторный анализ в основе своей разработан Терсто- 
ном и базируется на предположении о наличии в любой корреля- 
ционной матрице более чем одного общего фактора, а также груп- 
повых и специфических факторов. Мультифакторная модель. 
была представлена выше, в табл. 7.1.3 (для трех общих факторов). 
Именно для мультифакторного анализа справедливо в общем 
виде основное матричное уравнение ФА — уравнение (7.1.9). 

В отличие от однофакторного анализа мультифакторный 
анализ не исчерпывается процессом факторизации, а включает 
еще одну ступень, так называемую «ротацию». Кроме того, про- 
цесс факторизации здесь является многошаговым, и число птагов 
факторизации определяется рядом обстоятельств, требующих 
дополнительного объяснения. В этой связи, прежде чем перехо- 
дить к конкретному рассмотрению процедуры одного из наиболее. 
распространенных методов мультифакторного анализа — центро- 
идного — необходимо дать геометрическую интерпретацию кор- 
реляционной и Ффакторной матрицам. 


7.3.1. Геометрическая интерпретация корреляционной 
и факторной Е. 


Коэффициент корреляции г, между переменными [и j MH- 
терпретируется следующим образом: 


Ti; = hi: hj COS aj, DE Soa 
где h; — длина вектора, изображающего {-тую переменную; k; — 
длина вектора, изображающего }-тую переменную; Q; — угол 


между векторами h; и hj. 
Запас общей изменчивости для Ётой переменной на основании 
(7.3.1) можно представить как 


ENE 
Ti = hi * COS Чу, 


где cos Qy = 1 (a; = 0), т.е. иначе говоря, каждую перемен- 
ную можно охарактеризовать величиной вектора h; = 1, опреде- 
ляемого как положительное значение корня квадратного из 
запаса общей изменчивости по данной переменной. Таким обра- 
зом, зная или как-либо определяя запасы общей изменчивости 
по всем переменным, можем ‘определить значения векторов, 
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характеризующих эти переменные. Далее, пользуясь уравнением 
(7.3.1), в котором для каждой пары переменных известны значе- 
ния Tij а также h, и h;, можем определить 


Г] 


Е (7.3.2) 


Cos 0; = 
откуда находится и угол а,,. р 

Система векторов, длина каждого из которых определяется 
элементами главной диагонали, а углы между каждой. парой 
которых — остальными элементами корреляционной матрицы, 
называется конфигурацией векторов. Из сказанного ясно, что 
каждой сокращенной корреляционной матрице однозначно со- 
ответствует некоторая конфигурация векторов, и наоборот *. 

Факторная матрица геометрически интерпретируется следу- 
ющим образом. Исходным является предположение об ортого- 
нальности факторов. Каждый фактор рассматривается как вектор 
единичной длины, ортогональный всем другим таким же векторам. 
Таким образом факторы образуют прямоугольную систему коор- 
динат (систему соотнесения), число осей в которой равно числу 
столбцов в сокращенной матрице факторов. Очевидно, что при 
более чем трех факторах наглядное изображение системы коор- 
динат невозможно, но обычно используется плоское aporten: 
ние для всех пар осей. 

Факторные заряды ]-той переменной. геометрически интерпре- 
тируются как проекции вектора данной переменной на соответ- 
ствующие координатные оси. Такая интерпретация основана 
на представлении факторного заряда как коэффициента корреля- 
ции данной переменной с данным фактором и, следовательно, 
на представлении этого коэффициента корреляции как косинуса 
угла между вектором переменной и соответствующей осью KO- 
ординат. Дадим для примера геометрическую интерпретацию 
сокращенной факторной матрицы, представленной в табл. 7.3.1. 


Двум факторам, которые считаются независимыми, поставлены. 
в соответствие две перпендикулярные оси единичной длины 


(рис. 7.3.1). Чтобы получить конфигурацию векторов, восполь- 
зуемся факторными зарядами из табл. 7.3.1. Первый вектор 
имеет факторные заряды 0,7 и 0,3. Следовательно, конец первого 
вектора в координатах F; F, — это точка с координатами (0,7; 
0,3): Геометрически первый вектор находим, соединяя эту точку 
с началом координат. Аналитически длину вектора kı определяем 
по теореме Пифагора: 


h$ = 0,72 +0,3? =0,58, 
1=V0,58 ~ 0,76. 


= Разумеется, это не снимает вопроса о статистической достоверности 
_как самой корреляционной матрицы, так и конфигурации ее векторов. 
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Первое из этих двух уравнений еще раз поясняет смысл запаса 
общей изменчивости как суммы квадратов факторных зарядов: 
данной переменной. 

Аналогично определяем длины остальных векторов перемен- 
ных, изображенных на рис. 7.3.1. Можно видеть, что конфигура- 
ция векторов задана в сокращенной факторной матрице посред- 
ством системы координат и факторных зарядов. 

Таким образом, факторная структура, геометрически интер- 
претирующая факторную матрицу, объединяет конфигурацию 


Таблица 7.3.1 А, 
Факторы 
г а 
> | ге 
= 1 0,7 0,3 
я 2 0,9 0,0 
Я 3 0,4 0,6 
2 4 0,6 0,3 
(ab) 
3 | 


векторов с системой координат. 
Вся сложность вопроса, од- 
нако, состоит в том, что в. кор- 
реляционной матрице система 


координат заранее никак He Рис. 7.3.1. Факторная структура по. 
мы 


Е 
0 02 os OE- 0E 


определена: не определены ни табл. 


число факторов (осей соот- F, и Е, — первый и второй` факторы соот- | 
несения), ни величины þak- ` ветственно; 1—4 — векторы переменных. 
торных зарядов. Методов фак- 

торизации существует много, и в результате каждого полу- 
чается факторная матрица, по-своему ориентирующая коорди- 
натные оси относительно конфигурации векторов. Из рис. 7.3.4 
легко видеть, что вращая систему координат вокруг начала от- 
счета, можно получить бесконечное разнообразие проекций кон- 
фигурации векторов на оси координат, следовательно, существует 
бесконечно большое количество факторных матриц, отличающихся 
по крайней мере величилами факторных зарядов (не говоря уже 
о числе осей). Очевидно, чтобы избавиться от множества решений, 
необходимо наложить какие-то ограничения, позволяющие вы- 
брать одно единственное решение. Это в мультифакторном ана- 
лизе и достигается путем ротации.. 


7.3.2. Центроидный метод факторизации. 


Среди других методов центроидный метод факторизации AB- 
ляется наиболее распространенным. Он основывается на том, 
чтобы каждую ось соотнесения проводить через «центр тяжести» 
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конфигурации векторов, отсюда и название метода. Смысл центро- 
идного метода поясняется рис. 7.3.2. Рассматривая окончания 
векторов в конфигурации как систему материальных точек, можно 
определить центр тяжести (центроид) этой системы (точка Ya 
‚на рис. 7.3.2). Тогда ось первого фактора проводится через две 
точки: начало конфигурации векторов (точка О на рис. 7. 5. 2) 
и точку S} 

В случае, если мы имеем дело с двумерной системой латентных 

переменных, в которой конфигурация векторов лежит в одной 
плоскости, алгебраическая сумма проекций векторов на ось 
второго фактора (F, на рис. 
-= 7.3.2), перпендикулярную к 
первой и лежащую в той же 
плоскости, будет равна нулю. 
Такое положение системы коор- 
динат называется центроидным. 
Отсюда происходят специаль- 
ные термины: центроидный ме- 
 тод, цЦентроидные — факторы, 
центроидная ось. 

Алгоритм — факторизации 

центроидным методом имеет 
циклическую структуру, в ко- 


Е ai 
2 торой столько циклов (шагов), 
Рис. 7.3.2. Пояснение смысла цен- Сколько общих факторов можно 
троидного метода. извлечь из корреляционной 


р meniaga, pope матрицы, согласно уравнению 

второго фактора. (7.1.9). Каждый цикл (кроме 

последнего) состоит из четырех 

этапов. Первые три по смыслу те же, что и при однофакторной 

модели, а четвертый обусловлен спецификой центроидного метода 
мультифакторной модели. - 

Первый этап — извлечение 1-того harrapa боущесмонена 


по уравнению _ 


а; = а | P rj, (7.3.3) 


I 


где а;; — заряд i-TOro фактора в ]-той переменной; г; — сумма 


коэффициентов корреляции в ]-том столбце, включая запас об- 
щей изменчивости, h}; T — сумма всех коэффициентов корреляции 
в матрице, включая запасы общей изменчивости. Для проверки 
вычисляют Е и проверяют выполнение приближенного равен- 


ства Pan ~ УТ. 
Из T n (7.3.3) с очевидностью следует, что исходная 
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корреляционная матрица должна удовлетворять следующим тре- 
бованиям: | 
>", а 0, 
I 
T>0, | (7.3.4) 
$> 0 для всех j. 


Кроме того, необходимы точные значения запасов общей измен- 
чивости hj, которые существенно влияют на величину Q; Требо- 
вания (7.3.4) выполнить нелегко. Во-первых, как мы видели 
(рис. 7.3.2), после извлечения каждого центроидного фактора 
A —= 0. Во-вторых, даже исходная корреляционная матрица 


MOG содержать такое количество отрицательных значений T;j, 
что Г будет отрицательным. В-третьих, мы заранее не знаем 
точных значений h. 

Чтобы выполнялись первые два условия из (7.3.4), к остаточ- 
ной матрице всегда, а к исходной по необходимости, применяется 
специальное преобразование (обращение) матрицы *. Чтобы вы- 
полнить третье условие из (7.3.4), надо приближенно (но как 
можно лучше, точнее) определить значения h}. С этого обычно 
и приходится начинать первый этап факторизации. 

Для определения запасов общей изменчивости существует 
несколько методов. Простым и наиболее употребительным яв- 
ляется метод наивысшей корреляции. Он состоит в том; что в ка- 
честве k? принимается абсолютная величина максимального 
коэффициента корреляции в ]-том столбце. Основанием является 
тот факт, что длина вектора с наибольшим приближением опре- 
деляется через его проекцию на ближайший к нему вектор. Точ- 
ность метода, однако, зависит от порядка матрицы и характера. 
распределения значений коэффициентов корреляции в столбце. 
Для матриц порядка более 10 этот метод считается. достаточно 
хорошим. Метод наивысшей корреляции дает переоценку запаса 
общей изменчивости в столбцах с относительно большим числом 
низких коэффициентов корреляции и дает недооценку hå в столб-. 
HAX с большим числом высоких 7;,. В случае, если значения (#7) *, 
вычисленные после извлечения всех общих факторов, значительно, 
отличаются ** от исходных, определявшихся по методу наивыс- 
шей корреляции, процедуру роториаянии повторяют заново, 


* Оно все-таки чаще применяется к остаточным матрицам, поэтому мы 
рассматриваем его как составляющее четвертый этап факторизации. 

** Так как h3 имеет смысл р то проверить, существенно ли 
или случайно отличаются величины = ти пах И (a) ‘можно, используя 
дисперсионное отношение Фишера: Fà A a h3 | (h3)* при #3 > (h5) и 

2)* 2 * 
Рут, = (#8) [h3 при h< (hł)*. Значения fı = fz равны числу коррелирова- 
вшихся пар. 
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взяв в качестве исходных значения (1})*. Этот процесс повто- 
ряется столько раз, сколько необходимо для «сходимости» значений 
(13)* к некоторой постоянной величине (пределу), принимаемой 
за «истинное» значение 12. 

Второй этап — получение репродуцированной и остаточной 
матриц — выполняется так же, как и при однофакторной модели. 
Согласно уравнению (7.2.2), умножая каждый элемент: факторной. 
матрицы-столбца, полученной на Y-OBOM шаге, на каждый элемент 
ее транспозиции (матрица — строка), получают репродуциро- 
ванную матрицу у-ового шага. Далее поэлементно по уравнению 


Г. 


O s 


Рис. 7.3.3. Геометрическая 
интерпретация остаточной 
матрицы. 


Перенося начало отсчета из точки 
О в центроид 8,, мы изменяем дли- 
ну векторов 1—6, которые в новой 
системе отсчета обозначены пунк- 
тиром. Видно, что длины векторов 
уменьшаются пропорционально 
уменьшению их проекции на ось Fi, 
но при этом проекции на ось F} не 
изменяются. 


Го | 
(7.2.4) определяют у-овую остаточную матрицу, Важно отметить, ` 
что диагональные элементы (7), записываются отдельно, а 
в остаточной матрице по главной диагонали располагают опять 
максимальные по абсолютной величине значения остаточных 
коэффициентов корреляции соответствующих столбцов. Правиль- 
ность вычислений проверяют приближенным выполнением ра- 


венства Žr; — 0 для каждого столбца остаточной матрицы. 


I 

Геометрическая интерпретация ‚остаточной матрицы ясна из 
рис. 7.3.3: перенося начало отсчета в центроид 9,, получают 
новые значения векторов (на рис. 7.3.3. изображены пунктиром). 

Гретий этап — проверка возможности дальнейшего извле- 
чения факторов — тоже выполняется аналогично однофакторной 
модели Спирмена. Здесь чаще всего используются, во-первых, 
уже рассмотренный критерий (7.2.9), причем считается, что факто- 
ризацию можно продолжать, если произведение двух максималь-_ 
ных факторных зарядов у-ового фактора по крайней мере вдвое 
больше о,*, во-вторых, специальный критерий Саундерса и, 
в-третьих, уравнения Терстона. 


* Согласно В. Д. Небылицыну, д, = У} но, очевидно, при М <100 
лучше использовать уравнение (7.2.9). 
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Использование критерия Саундерса oneta K следуем» 
Вычисляются три величины: 


: ' 2n 


PH» 


sE 2 ; 
B=( =Y, (7.3.5) 


| 1 2 
С e >=) 
В 


где n — число переменных; Л — число коррелировавшихся пар 
(объем выборки); у — количество общих факторов, выделенных 


за у шагов факторизации; тр — остаточные коэффициенты кор- 
реляции после извлечения у-ового фактора Fy; 2r i — сумма. 


квадратов Ty (без запасов общей изменчивости) во сай остаточ- 
ной матрице; Гу; — факторный заряд у-ового фактора в той 
переменной; 2 — сумма квадратов всех факторных зарядов 


в -матрице о после извлечения уУ-ового фактора. Далее _ 
проверяется условие Саундерса: 


факторизация закончена, если A< ВС, (1.3.6) 
‘факторизацию ‘еледует продолжать, если АВС. ``” 
р 


Для прекращения факторизации и для’ априорного опреде- 
ления порядка корреляционной матрицы, необходимой для из- 
влечения т факторов, Терстоном предложены уравнения, свя- 
зывающие порядок матрицы п и минимальное число общих фак- 
торов т, которое можно извлечь из матрицы порядка п: 


n=0,5(2m+1+V8m+1), 
: m=0,5 (2n +1—V8n £1), 


где получаемые n и т округляются до ближайшего целого зна- 
чения. Для n < 15 значения т приведены в табл. 7.3.2. Принято 
считать, что на практике лучше всегда превзойти минимальный 
порядок матрицы, необходимый для определения данного числа 
факторов. 


(7.3.7) 


Таблица 7.3.2 
о 
Е 

Рассмотренные критерии прекращения факторизации не дают, 


как мы покажем на примере, однозначного решения. Наибо- 
лее «жестким» является а (правило а. стандартных 


393 


м. 


отклонений). Наименее «жестким» является критерий Саундерса, 
он позволяет извлечь наибольшее ‘количество факторов. Уравнения 
'Терстона занимают промежуточное положение и используются 
чаще всего. 

_ Четвертый этап — «обращение» (преобразование) остаточной 
матрицы, необходимое для выполнения требования (7.3.4). Су- 
ществуют разные методы обращения. Один из них приведен 
в работе В. Д. Небылицына *. Мы на примере рассмотрим более 
- простой (с точки зрения возможных ошибок) аналитический метод. 
Здесь важно отметить, что смысл любого из методов обращения 


Рис. 7.3.4. Геометрический 
смысл обращения остаточ- 
ной матрицы. 


Пунктиром изображены векто- 
ры, имеющие отрицательные 
проекции на ось второго фак- 
тора (—РЕ.). Сплошной линией 
(во втором квадранте) обозна- 
чены те же векторы после об- 
ращения. $», — новый центроид, 
в который будет перенесено 
начало отсчета после извлече- 
ния второго фактора (начало 
отсчета для геометрической ин- 
терпретации второй остаточной 
матрицы). 


теометрически сводится к тому, чтобы часть векторов из конфигу“ 
рации, соответствующей остаточной матрице, имеющих отрица- 
тельные значения проекций на ось у + 1-го ортогонального 
‘фактора, повернуть относительно уУ-ового центроида на 180°. 
Пояснение дается на рис. 7.3.4. Очевидно, что в обращенной 
остаточной матрице для тех коэффициентов корреляции, которые 
соответствуют обращавшимся векторам, знаки должны быть 
изменены на противоположные. Правила изменения знаков рас- 
смотрим в примере. 

Циклическая процедура факторизации прекращается на треть- 
ем этапе некоторого у-ового цикла, когда проверка показывает, 
что больше факторов извлечь нельзя. В результате получается 
‘сокращенная матрица факторов, имеющая у столбцов. Для про- 
верки удовлетворительности факторизации необходимо, умножая 
окончательную сокращенную матрицу факторов на ее транспо- 
зицию, получить репродуцированную матрицу и, вычитая ее 
из исходной сокращенной корреляционной матрицы, найти оста- 
точную матрицу, все элементы которой должны быть близки 
к нулю. | 


= ЖВ. Д. Небылицын. Современное состояние факториального 
‚анализа. «Вопросы психологии», 1960, № 4. 
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Выше указывалось, что сокращенную факторную матрицу 
можно рассматривать как одну из возможных реализаций фак- 
торной структуры, причем не самую лучшую. Чтобы в опреде- 
ленном смысле улучшить (упростить) факторную структуру, 
полученную центроидным (или другим) методом, вращают си- 
стему координат (или отдельные оси) относительно конфигурации 
векторов. 


7.3.3. Простая латентная структура и ротация 


Для определения наилучшей позиции системы координат 
‘относительно конфигурации векторов предложено немало кри- 
териев. 

Во-первых, можно руководствоваться тенденцией к согласо- 
ванию результатов ФА с результатами, полученными другими 
методами. | 

Во-вторых, можно стремиться согласовать свои результаты 
с результатами других исследователей, применявших ФА. 

В-третьих, можно стремиться K^ получению совокупности 
факторных зарядов, соответствующих каким-то общим положе- 
ниям данной психологической дисциплины. 

В-четвертых, можно стремиться к тому, чтобы оси соотнесе- 
ния проходили через центроиды «пучков» корреляций, если 
`таковые имеются в конфигурации векторов. 

В-пятых, можно руководствоваться принципом «простой струк- 
туры», выдвинутым 'Терстоном. В основе концепции «простой 
структуры» лежит мысль о том, что из нескольких гипотез, оди- 
наково хорошо объясняющих факты, следует выбирать наиболее 
простую, требующую наименьшего числа вспомогательных гипо- 
тез. Простота латентной структуры состоит в том, что каждая 
переменная имеет относительно простое факторное содержание, 
т.е. доминирует заряд одного какого-то фактора и, наоборот: 
«мерой» данного фактора: являются только некоторые (а не все) 
переменные из анализируемой совокупности. Иными словами, 
идея простой структуры реализуется в том, чтобы, вращая 
оси координат, «расщепить» общие факторы до системы груп- 
повых. | 

Конкретно, стремясь к простой структуре, руководствуются 
следующими положениями: 1) вращая координатные оси, полу- 
чить наибольшее возможное число максимальных по модулю 
факторных зарядов; 2) получить наибольшее число ‘нулевых. 
(близких к нулю, в пределах + о,) факторных зарядов. Таким 
образом, максимум для одних факторных зарядов и минимум 
для других — вот критерии «простой структуры», по которым 
осуществляется ротация. Нетрудно видеть, что критерии проти- 
воречивы, и конкретное решение обычно требует компромисса. 

Математический смысл ротации — это поворот ортогональной 
‘системы координат относительно неизменного начала отсчета 


395 


Ра <. Eme S . А . а 


на некоторый угол p. При допущении, что факторы облические, 
ротации подвергают отдельные оси координат. 

_ Рассмотрим существо процедуры ортогональной ротации *, 
которую ниже поясним на примере. Ортогональная ротация 
двумерной системы сводится к двум этапам. Первый — опреде- 
ление угла p, на который следует повернуть систему координат 
в плоскости, для того чтобы по возможности удовлетворялись 
критерии «простой структуры». При вычислениях вручную это 
_проделывается геометрически на чертеже. Второй этап — вы- 
числение новых значений факторных зарядов. Геометрически 
эта задача решается достаточно просто и точно следующим об- 
разом. | 

На стекло с яркой подсветкой снизу накладывается начер- 
чённая в удобном крупном масштабе на кальке конфигурация 
векторов. Прямоугольная система двух координатных осей, 
вычерченная в том же масштабе (длина оси полагается равной‘ 
единице!) на миллиметровой бумаге, накладывается сверху; 
начало координат и начало конфигурации векторов совмещаются. 
Далее, вращают миллиметровую бумагу, стремясь удовлетво- 
рить требованиям «простой структуры» (или каким-либо другим 
из рассмотренных). Найдя искомое положение осей, по милли- 
метровке на осях отмечают новые проекции концов всех векторов 
конфигурации, которые затем определяют (по миллиметровке же) 
в числовом виде. Эти новые проекции и образуют сокращенную 
факторную матрицу после ротации. 

Аналитическая процедура вычисления факторных зарядов 
после поворота системы на угол ф сводится к умножению исход- 
ной сокращенной факторной матрицы на так называемую матрицу 
поворота **. Элементами матрицы поворота являются синусы 
и косинусы (с учетом их знаков) из известных формул для новых 
координат при повороте двумерной системы против часовой 
стрелки: 


д’ =хсозф-Рузш ф, | (1.3.8) 


у = —хяиф-усо3ф. 


где xz, у- старые координаты (z — абсцисса, у — ордината); 
т’, у’-— новые координаты; ф — угол поворота против часовой 
стрелки. 


* Облическая ротация сложнее ортогональной не только по процедуре, 
но, главным образом, по интерпретации получаемых факторных зарядов. 
Ее рассмотрение выходит за рамки данной работы. 

** П. С. Александров (Лекции по аналитической геометрии. 
«Наука», М., 1968, стр. 191) называет эту матрицу «матрицей преобра- 
зования координат», что широко, так как понятие преобразования включает 
и перенос. 
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Таким образом, матрица поворота (Л) для двух фак рных осей 
(x и у) имеет вид*: 


(7.3.9) 


созФ sin ф 
_ |= эф coso 


Зная ф, элементы матрицы (7.3.9) легко определить по таблицам 
тригонометрических функций. 

При количестве осей в системе координат более двух элементы 
матрицы поворота вычисляются следующим образом. Сначала 
записывается матрица «нулевого» поворота (À) — это единич- 
ная матрица **, порядок которой равен числу факторов (т). 


Е apauep, для пяти факторов: 


обо 
о: 000 
- №=10 0100. 
00-915 
0000 i 


Пусть факторные оси нумеруются слева направо и сверху вниз: 
i = 1, 2, 3, 4, о и требуется повернуть пару осей i, k (где А = 

= 1, 2, 3, А, 5, ной + k) на угол Фф,, где j — номер последовательно 
осуществляемых поворотов (j =1,2,..., (т — 1)). Тогда, уда- 
JAA из матрицы Ào все строки и столбцы, кроме соответствующих 
осям фи К, получаем подматрицу ^^”. Это тоже единичная матрица: 

Г 

| 0 
не изменится) и дополняя À удаленными ранее из № столбцами и 
строками, получаем матрицу ]-того поворота осей i, К (^^). 

Например, желая повернуть оси 2 и 4, находим подматрицу 


O 
1 


. Умножая ее на матрицу поворота осей À (7.3.9) (от чего À 


) 


1 
(2,4) — ; 


и, умножая ее на матрицу À, получаем 


cos; sin Q; 


A(28). A = 


—sin ; с0$Ф; 
* При повороте на отрицательный угол (по часовой стрелке) матрица 
поворота транспонируется: 


z’ 08% —sin& 


sin & Cos Œ 


+* Элементами матрицы поворота являются так называемые «направля- 
ющие косинусы», характеризующие положение системы координат. Для 
каждой оси в т-мерной системе этих косинусов т. При нулевом повороте 
(угол поворота 0°) косинус угла со своей осью равен единице, а со всеми 
другими (в прямоугольных координатах) — нулю. 
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Дополняя произведение удаленными ранее строками и столбцами 
матрицы Àg, окончательно получаем матрицу поворота осей 2 и 4: 


1 0 ом 
О созФ 0 эзшф 0 
А: 10 0 си: 
|0 —$1Ф;, 0 с0зф, 0 
оо 


Аналогичным путем получаем матрицу 1-го поворота двух других 
осей, например, 3 и ð: } 


49 0 0 0 
| 90:1 0 0 0 
3-10 0-е, D sin ф, |. 
9..0 0 ts 0 


ОО —5щФ 0 cos Q; 


Hoa. l = j + 1, T. e. повороты осуществляются последо-_ 
вательно, сначала ]-тый, а потом /-ный. Используя ассоциатив- 
ность умножения матриц, можем сразу осуществить оба указанных 
поворота. При этом матрица совместного поворота двух пар осей 
‘определяется умножением слева матрицы ÀH на матрицу //?’°: 


Е 0 0 0 

О с05ф, 0 sin О, 
290 = “CA г А = Ду: =-20 cos Ọ; 0 sin Ф, |, 

0 —sin Qj 0 созф, 0 

0 0 — sin Q; 0 cos Q; 


где ф;иф, — углы ]-того и [-го поворотов. Если бы потребовалось 
последовательно осуществить еще один поворот, для которого полу- 
чена матрица ^^", то новая матрица совместного поворота опреде- 
лялась бы произведением слева: 

<, AABN в. — At, 153, 5) ‚6. h) 

В случае т-мерной системы ортогональная ротация сводится 
к попарному вращению осей; число возможных последовательных 
вращений (m — 1). Важно отметить, что практически при т > о 
осуществление ротации вручную затруднительно и следует ис- 
пользовать ЭВМ. 

После ротации вновь осуществляется проверка: умножая 
факторную матрицу после ротации на ее транспозицию, опре- 
деляют репродуцированную матрицу и сравнивают ее как с HC- 
ходной, так и с репродуцированной матрицей до ротации. 
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1.3.4. Пример мультифакторного анализа 
с ортогональной ротацией 


Для иллюстрации мультифакторного анализа рассмотрим 
конкретный числовой пример, полученный в реальном исследо- 
вании, в котором батарея из шести тестов применялась к группе 
учащихся профессиональной школы *. В результате попарного 
коррелирования оценок по тестам (1-й методический вариант ФА) 
получена сокращенная корреляционная матрица, приведенная 
в. табл. 7.9.3, 

_ Так как все коэффициенты корреляции в исходной матрице 
положительны, можем непосредственно приступить к вычисле- 
нию первого центроидного фактора. Для этого сначала заполним 
главную диагональ значениями запасов общей изменчивости, 
в качестве которых выберем в каждом столбце максимальное 
значение коэффициента корреляции (как это сделано в табл. 7.3.3). 
Вычисления зарядов первого центроидного фактора, согласно 
уравнению 7.3.3, а также необходимые проверки (равенство сумм 
по строкам и столбцам и равенство : а; ~ У Г) приведены 
тоже в табл. 7.3.3. 

Таблица 7.3.8 


Исходная сокращенная матрица корреляций и результаты вычисления 
зарядов первого центроидного фактора 


Рен 
1 0,400 0,299 0,400 0,297 0,116 0,232 1,744 
r- 0,299 0,568 0,568 0,534 0,432 | 0,154 2,955 
3 0,400 0,568 0,568 0,487 0,436 0,071 2,930 
4 0,297 0,534 0,487 0,549 0,545 0,092 | 2,500 
9 0,116 0,432 0,436 0,549 0,545 0,016 2,058 
6 | 0,232 0,154 0,071 0,092 0,016 0,232. 0,765 


Dri 1,744 2 555 2,530 2,500 2.058 0,765 T 
7 —=12.152 
aij | 0500 | 0733 0,726 0,747 0.590 0.219 


Ут =3,486;  Уди=3,485 
7 


Умножая матрицу-столбец полученных факторных зарядов 
на ее транспозицию, определяем первую репродуцированную 
матрицу, она приведена в табл. 7.3.4. Вычитая поэлементно 
первую репродуцированную матрицу из исходной корреляционной 


* Заимствован из KH.: ОКбп Jan. Analiza czynnikowa w psycho- 
logii. Panstwowe wydawnictwo naukowe. Warszawa, 1960. 
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Таблица 7.8.4 
_ Первая репродуцированная матрица ; 


7 ZA | 2 | 3. | 4 | 5 | 6 


F aıj 0,500 | 0,733 0,726 | 0,717 | 0,590 0,219 


0,500 | 0,250 0,386 0,363 0,358 . 0,295 0,110 
0,733 0,386 0,537 0,532 0,526 0,432 0,160 
0,726 0,363 0,532 -0,527 0,520 0,428 0,159 
` 0,358 0,526 0,520 0,514 0,423 0,157 
0,590 0,295 0,432 0,428 0,423 0,384 0,129 
0,219 0,110 0,160 0,159 0,157 0,129 0,048 


$ OA © № — 
© 
—1 
prad 
~] 


матрицы, определяем первую остаточную матрицу, она Nph- 
ведена в табл. 7.3.5. Суммируя по столбцам, убеждаемся в том, 
что центрирование выполнено безошибочно: суммы на порядок 
меньше значений остаточных коэффициентов корреляции, т. е. 
практически равны нулю. Геометрическая интерпретация полу- 
ченной остаточной матрицы как раз и была дана на рис. 7.3.3. 


Таблица 7.3.5 


Первая остаточная корреляционная матрица 


j | 1 | 2 3 4 

1 (0,150) | —0,067 | 0,037 | —0,064 | —0,179 | 0,423 
2 —0,067 | (0.031)| 0,036 | 0,009 | 0,000 | —0,006 
3 0,037 | 0,036 | (0,041) | —0033 | 0,008 | —0,088 
4 —0,064 | 0.009 | —0,033 |. (0,031)| 0,122 | —0,065 
5 —0,479 | 0,000 | 0,008 | 0,122 | (0497)| —0,145 

6 0,123 | —0,006 | . 0,088 | 0065 | —0,145 | (0,185) 

Sr 0,003 | 0,003 | 0,001 | 0,003 | 0,003 | 0,004 
> 


Теперь следует убедиться, можно ли продолжать факториза- 
цию. Прежде всего, пользуясь табл. 7.3.2, устанавливаем, что 
из корреляционной матрицы порядка 6 можно извлечь три общих 
фактора. Однако с целью демонстрации применим также крите- 
‘рии «стандартного отклонения» и критерий Саундерса. 


Число коррелировавшихся пар Л = 133, поэтому о, Е: 


= 5z zæ 0,087. Можно видеть, что несколько остаточных коэф- 
фициентов корреляции из табл. 7.35.5 по модулю превосходят 


20, = 0,474. 
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Применим F Саундерса. По формулам (7.3.5) вычисляем: 
АЕ “0,243 =2,4. 9,213 <= 0:51, 
в=(=) =0,694, 


13,988 _ 
в = — (6 — 2,26)? = -iss 20,105, 


ВС = 0,073 < А = 0,511, 


T. €., следуя правилу (7.3.6), факторизацию можно продолжить. 
Но для этого: необходимо обеспечить выполнение условий (7.3.4) 
и преобразовать первую остаточную матрицу для получения 
положительных сумм по столбцам. Наиболее простой алгоритм 
преобразования (обращения) состоит в следующем. 

1. Вычисляем алгебраические суммы всех столбцов, не учи- 
тывая запасы общей изменчивости; эти суммы записываем в строке 
э`таол. 1.3.6 T: 

Таблица 7.3.6 


Пресбразование первой остаточной корреляционной матрицы 


Переменные 1 2* 3* 4% - Tia 6 
1 0,179 | (-) (25 (+) (+) 
(0,150) — 0,067 0,037 — 0,061 —0;179 0,123 
2* (+) 0,067 (--) 
—0,067 (0,031) 0,036 0,009 0,000 | —0,006 
3* (-=) 0,088 (+) 
0,037 0,036 (0,044) —0,033 0,008 | —0,088 
4* (+) 0,122 Е 
— 0,061 0,009 — 0,033 (0,034) 0,122 —0,065 
g. 0,179 
— 0,179 0,000 0,008 0,122 (0,197) — 0,145 
6 0,123 | (+) +) EF) +) 0,145 
— 0,006 —0,088 —0,065 —0,145 (0,185) 
§ —0,147 —0,028 —0,040 — 0,028 —0,194 —0,181 
—0,55 0,0735 0,0140 0,0200 0,0140 0,0970 0,0905 
5* —0,1055 0,0140 |, 0,0280 0,1360 0,0970 | —0,0545 
—4* — 0,1665 0,0230 | —0,0050 0,1360 0,2190 | —0,1195 
ot —0,2335 0,0230 | | +0,0310 0,4450 | 10,2190 | —0,1255 
+3*=— B -ļ] —0,1965 0,0590 0,0310 0,1120 0,2270 | —0,2135 
—2B | 0,393 (—) 0,118 | (—) 0,062 | (—) 0, 224 | (—) 0,454 _ 0,427 
| 2B |+ h}. 0, 572 0,185 0, 150 0 346 0, 633 ~ 0,572 


Пр имечание. §— суммы по столбцам без запасов общей изменчи- 
вости. В— последняя из обращенных строк, она содержит накопленные 


суммы (5), 
128 |--} = Š rj. 
7. 
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Таблица 7.3.7 _ 
Вторая остаточная матрица корреляций и ее преобразование 


Переменные 1 2* 3* 4 5 5* 
о ов СД и в A 
| (=) | ЕЕ) (--) 
1 0.072 0,024 — 0,072 —0,019 0,032 — 0,010 
n eS (+) (--) 
0,024 0,047 0,025 — 0,016 — 0,047 — 0,037 
3* (+) (+) (-) 
— 0,072 0,025 0,072 — 0,054 — 0,030 0,054 
4 — 0,019 (+) (+) (--) 
— 0,016 — 0,054 0,054 0,033 —0,015 
5 0,032 | (+) (+) (F) 
— 0,047 — 0,030 0,033 0,047 — 0,002 
6* (+) . Е =) 
— 0,010 — 0,037 0,054 —0,015 — 0,002 -0,054 
S —0,045 — 0,051 — 0,077 —0,071 — 0,014 —0,010 
—0,55 0,0225 0,0255 0,0385 0,0855 0,0070| . 0,0050 
+3* — 0,0495 0,0505 0,0385 —0,0185| —0,0230 0,0590 
+2* — 0,0255 0,0505 0,0635 —0,0345| —0,0700 0,0220 
—- 6* = В — 0,0355 0,0135 0,44175 —0,0495| —0,0720 0,0220 
—2B 0, 071 (—) 0,027 | (—) 0,235 0,099 0,144 (—) 0,044 
128 | +h? 0 143 0, 074 0, 307 0,153 0,191 0.098 


Примечание. Обозначения те же, что и в табл. 7.3.6. Запасы об- 
щей изменчивости (подчеркнуты дважды) получены по методу наивысшей 
корреляции. 


2. Заполняем строку —0,55. 

3. В строке —0,55 находим наибольшую положительную 
величину.* Соответствующий: этой величине столбец будет об- 
ращен в первую очередь. Это столбец переменной 5, обозначим 
его звездочкой. 

4. Обозначая звездочкой строку переменной 5, складываем 
ее со строкой — 0,5 : S, не учитывая значения hg. Результаты 
записываем в строку +5*. Коэффициент, лежащий на пересе- 
чении --5*-й строки и столбца 5*, подчеркиваем прямой линией, 
слева от этого числа проводим вниз прямую линию, как показано 
в табл. 7.3.6. 

5. В полученной строке --5* снова находим наибольщее 
положительное значение. Для соответствующего столбца и строки 
выполняем предписание предыдущего пункта 4. В результате 
получаем строку +4* табл. 7.3.6. 

6. В полученной строке (+4*) снова ‘находим наибольшее 
‘положительное значение (при этом. значения, лежащие в уже 


* Ошибки не будет, если вместо наибольшей ие одну из больших 
положительных величин (см. табл. 7.3.7, строку +3). 
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обращенных столбцах, обозначенных прямыми линиями, не учи- 
тываются) и для него повторяем предписание пункта 4. 

7. Сложение строк, согласно пункту 4, повторяется до тех 
пор, пока в последней строке не получим большинство отрица- 
тельных величин (не считая уже обращенных столбцов). = 
последнюю строку обозначим В. 

8. Удваиваем все элементы строки В и изменяем их знаки 
на противоположные. Результаты записываем в строку —2В. 
Это суммы столбцов после обращения. переменных. Отрицатель- 
ные знаки заключаем в скобки, как показано в табл. 7.3.6. 

9. Вычерчиваем (или заключаем в скобки, как это сделано 
в табл. 7.3.5 и 7.3.6) остаточные запасы общей изменчивости. 
и над ними записываем новые значения, определенные из числа 
остаточных ‘коэффициентов корреляции соответствующих столб- 
цов по методу наивысшей корреляции. 

10. Изменяем алгебраические знаки в матрице остаточных 
коэффициентов корреляции в соответствии с преобразованиями: 

— изменяем на противоположные знаки всех коэффициентов 
в преобразованных строках, за исключением лежащих на пере- 
сечении с преобразованными столбцами; 

— изменяем на противоположные знаки всех олень 
в преобразованных столбцах, за исключением лежащих одно- 
временно в преобразованных строках. 

В табл. 7.3.6 измененные знаки записаны сверху в скобках. _ 
Значения остаточных коэффициентов корреляции с измененными 
знаками и новые запасы общей изменчивости образуют преобра- 
зованную (обращенную) остаточную корреляционную матрицу. 

11. Складывая абсолютные значения |2 В|[* и новые запасы 
общей изменчивости й}, получаем суммы Èr;, необходимые для 


вычисления зарядов второго фактора но уравнению . (7.3.3). 
Для проверки правильности вычислений эти же суммы получаем, 
непосредственно суммируя по столбцам преобразованную остаточ- 
ную корреляционную матрицу. 

Вычислив факторные заряды, необходимо определить их знаки. 
Для этого имеется общее правило. 

Знак факторного заряда у-ового фактора {-той переменной, 
которая не была преобравована или была преобразована четное 
число раз, сохраняется таким, каким он был для заряда первого 
фактора этой переменной. Знак факторного заряда переменной, 
преобразованной нечетное число раз, изменяется на противополож- 
ный по сравнению со знаком заряда первого фактора **. 


* „Геометрический смысл этих абсолютных значений, а также преобразо- 
ванной остаточной матрицы ясен из рис. 7.3.4. 

** Относительно знака заряда предыдущего (у — 1-го) фактора знак 
заряда у- AA фактора {-той переменной не изменяется, если переменная не 
была преобразована, или изменяется на противоположный, если переменная 
была прео разована на у-овом шаге факторизации. 
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В нашем примере переменные 2—5 были преобразованы нечет- 
ное число (один) раз, а переменные 1 и 6 — не преобразованы. 
Поскольку все заряды первого фактора были положительны, 
заряды второго фактора у переменных 1 и 6 сохранят положи- 
тельные знаки, а у переменных 2—5 получат отрицательные знаки 


(см. табл. 7.3.8). 


Таблица 7.3.8 


Факторная матрица после вычисления зарядов 
второго и третьего факторов 


$ , Факторы 
Переменные 
F, | Е» | Fs 
1 0.500 0,365 0,145 
2 0,733 -| —0,118 0,075 
3 0,726 —0,095 0,312 
4 0,717 —0,220 —0,155 
5 0,590 —0,404 —0,194 
6 0,219 0,365 — 0,099 


Дальнейшая процедура факторизации состоит в вычислении 
второй репродуцированной матрицы, которая получается умноже- 
нием столбца модулей зарядов второго фактора. на его транспо- 
‘зицию (аналогично’ табл. 7.3.4). Затем вторая репродуцированная 
матрица вычитается из преобразованной первой остаточной мат- 
рицы, в результате получается вторая остаточная матрица, при- 
веденная в табл. 7.3.7. Она преобразуется точно так же, как 
и первая остаточная матрица. Вычисляя по второй преобразован- 
ной остаточной матрице факторные заряды третьего фактора 
и применяя правило знаков, получим последний, третий столбец 
сокращенной факторной матрицы (табл. 7.3.8). Далее, снова 
умножая столбец модулей зарядов третьего фактора на его транс- 
позицию, получаем третью репродуцированную корреляционную 
матрицу, вычитая которую из второй преобразованной остаточ- 
ной матрицы, получаем третью остаточную матрицу, представлен- 
ную в табл. 7.3.9. 

Согласно уравнениям Терстона (7.3.7), исходная корреля- 
ционная матрица `шести переменных позволяет извлечь только 
три значимых фактора. Прекращая на этом основании фактори- 
зацию в данном примере, отметим следующее. Согласно правилу 
двух стандартных отклонений, факторизацию следовало а 
тить после извлечения второго фактора. Действительно, 20; 

= 0,174, как показано выше, а во второй остаточной корреля- 
ционной матрице нет ни одного элемента такой абсолютной BEIM- 
чины. С другой стороны, следуя критерию Саундерса, нам cego- 
вало бы продолжить факторизацию, извлекая четвертый фактор. 
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Таблица 7.3.9 
Третья оетаточная корреляционная матрица | 


Переменные 1 2 3 4 5 6 
| | 

1 0,051 | —0,035 0,027 | — 0,041 0,004 | —0,004 
2 —0,035 0,041 0,001 0,004 0,032 | —0,044 
3 0,027 |' 0,004 | —0,025 0,005 | — 0,030 0,023 
4 —0,041 0,004 0,005 0,030 0,002 0,000 
5 0,004 0,032 | —0,030 0,002 | 0,009 | —0,017 
6 —0,004 | —0,044 0,023 0,000 | — 0,047 0,044 

Суммы 0,002 | 0,001 | 0,001 | 0,000 0,000 0,002_ 

- | 


Действительно, пользуясь третьей остаточной и факторной Mart- 
рицами (табл. 7.3.8 и 7.3.7), вычисляем: 


ры 1 . 0,0168 = 2,4 - 0,0168 == 0,04: 
NAET A i n, 2. . 
Bet - ) = 0,25; 


C = -35 (6 — 2,96)? œ 255 =0,069; 


В.С = 0,25 0,069 = 0,017 < A = 0,04, 


т.е. допустимо продолжать факторизацию. Таким образом, 
уравнения Терстона на самом деле дают промежуточное значе- 
ние числа шагов факторизации. 

Закончив процесс факторизации, необходимо, умножив сокра- 
щенную факторную матрицу. (табл. 7.3.8) на ее транспозицию, 
получить репродуцированную матрицу, сложить ее с последней 
(третьей) остаточной матрицей (табл. 7.3.9) и результат вычесть 
из исходной корреляционной матрицы (табл. 7.3.3). Таким путем 
определяется матрица погрешностей, элементы которой не должны 
превышать нескольких тысячных долей. Часто используют сокра- 
щенный метод проверки, которым мы воспользуемся после ро- 
тации. 

Осуществим ортогональную ротацию системы соотнесения 
нашего примера, добиваясь выполнения требований «простой 
структуры». | 

Прежде всего определим проекции факторной структуры на. 
три взаимно перпендикулярные плоскости, в которых лежат 
пары осей: FFs; Р.Е. и FiF; При этом конец вектора каждой 
переменной будет изображен точкой: в плоскости F4, Fa — с коор- 
динатами (Qij, 45); в плоскости Fa, Fg — с координатами (aj; 3j); 
в плоскости F, Ё. — с координатами (Gij @з;), где координаты 
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(а; akj) — это пары зарядов г-того и А-того факторов из сокра- 
щенной факторной матрицы (табл. 7.3.8). Указанные проекции 
представлены на рис. 7.3.5. Рассматривая эти проекции, нельзя 
_ обнаружить ничего определенного в смысле требований «простой 
структуры» по Терстону. Но если повернуть систему осей F4, РЁ, 
на угол 45° против часовой стрелки (рис. 7.3.5, а), то можно видеть 
следующее. — | 
Заряды первого фактора у переменных 2—5 сохраняются на 
высоком уровне, а заряды этого фактора у переменных 1 и 6 


- fə 


Рис. 7.3.5. Три проекции факторной структуры, согласно табл. 7.3.8. 


а — для факторов F, и Fa; 6 — для Е. и Е; в^ для F, и F. Точками обозначены проекции 

концов векторов соответствующих переменных. Пунктиром показано положение осей 

Е: и F, после поворота на угол ф = 45°, удовлетворяющего (в первом приближении) 
требованиям «простой структуры». 


приближаются к нулю. Заряды второго фактора становятся 
положительными и увеличиваются* для всех переменных, кроме 
пятой, у которой заряд приближается к нулевому. Таким обра- 
зом, требования «простой структуры» в определенной мере выпол- 
няются. Здесь необходимо подчеркнуть, что практически эти 
требования всегда выполняются только в приближенной степени. 
Возможно, что несколько лучший результат получился бы при 
повороте не на 45°, а на; угол 30° 58°: тогда ось F, проходила бы 
почти через точку 5-й переменной, а ось F’, — через точку 6-й 
переменной, т.е. веса двух факторных зарядов стали бы нуле- 
выми, а веса большинства других еще несколько увеличились. 
Однако невозможно «на глазок» определить «наилучший» угол, 
такой, чтобы требования «простой структуры» выполнялись бы 
в строго количественном смысле. Для этого необходим последо- 
вательный процесс вращений с поиском двух экстремумов на 
основе вычисления значений критериев «простой структуры», что 
даже в простейшем случае двух факторов является сложной зада- 
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чей, требующей значительного числа переборов.* Мы поэтому 
ограничимся приближением, которое достигается поворотом на 45°, 
достаточным для целей примера. 

„Теперь остается получить числовые значения факторных 
зарядов по первым двум факторам после ротации (очевидно, что 
заряды третьего фактора не изменятся, так как система осей F, 
и F, вращалась вокруг неподвижной оси Р.). Воспользуемся 
аналитическим методом, для чего определим матрицу поворота 
системы осей F, и Fa 

Матрица нулевого поворота в нашем примере имеет порядок 3: 
_ Удаляя из матрицы Ào Deea 
столбец и строку F, (эта F, 


Pooh 
ось не вращается), полу- 
чаем подматрицу - 
0 F Е 0 
(1,2) = № = F? о 
1 | 


умножая которую на мат- 
рицу поворота осей Л 
(7.3.9) и добавляя обратно строку. и столбец F}, получаем матрицу 
первого поворота осей F, и F, с элементами sin 45° = 
— 603 45. = 0.14:. 


GTE FU © 
49:2) -0.04° 0,140 
0 о 1 


_ Чтобы получить значения факторных зарядов после первой 
ротации (поворота), умножаем сокращенную факторную матрицу 
«не вращавшихся» факторов (табл. 7.3.8, обозначим ее V,) на 
матрицу первого поворота À% ?: 


0,500 — 0,365 — 0,145 
0,733 —0,418 00725 
| 0,726 —0,095 — 0,312 GU- DP 
в т а 0o20 Cis] a o a 
0,590 —0,404 —0,194 ь eoa 
0,249 0,365 — 0,099 
0,096 0,644 — 0,145 
0,604 0,436 — 0,075 
0,582 0,448 0,342 
тт 50,655 0353 -GF 
- 0,705 0,432 -0,194 
—0,404 0,444 —0,099 
* Эту задачу успешно могут решить ЭВМ. 
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где У, — сокращенная факторная матрица после первой рота- 
ции, в которой столбцы (слева направо) соответствуют факторам 
Е, > F а строки (сверху вниз) — переменным 1—6. Проекции 
факторной структуры, соответствующей матрице V, приведены на 
рис. 7.3.6 (они получены тем же путем, что и проекции на рис. 7.3.5). 

Система из трех факторов позволяет выполнить еще одну 
ротацию, благодаря которой «простая структура» может быть 
улучшена. Рассматривая рис. 7.3.6, 6, можно видеть, что повернув 


-F 
1 
Рис. 7.3.6. Три проекции факторной структуры после первой ротации (соглас- 
но матрице V). 
а — для факторов Fi и Fa 6 — для факторов Ро и Fg в — для факторов Fi и Fg Точки — 


проекции концов векторов соответствующих ‘переменных. Пунктиром тт новое 
положение осей Fi и F ‚ после поворота на угол ф = 45°, в первом приближении удовле- 


своряющего требованиям «простой ’ структуры». 


систему осей F, и ГР. так, чтобы они проходили через точки 5 
и 3, мы получили бы два нулевых факторных заряда, а осталь- 
ные — максимально большие и положительные. Для этого нужен 
поворот на угол ф == 54° 30’. Мы, однако, для упрощения вы- 
числений в примере осуществим поворот снова на 45°, как пока- 
зано на рис. 7.5.6, Ő; этого достаточно в первом приближении 
«к простой структуре». 

Необходимо определить матрицу второго поворота осей F, 
и F,. Для этого из матрицы А. удаляем строку и столбец оси F4, 
которая не вращается, и получаем подматрицу: 


0 
о 1 


Умножая ее на À (7.3.9) и добавляя удаленную строку и стол- 
Gen F, получаем матрицу второго поворота, элементы которой 
ВАО, 5360845 — 0.10 


142,3) — 


10 0 
42:3) =|0 0,71 0,7 |. 


70 sen 20. 
4 08 


Тенерь можно получить значения факторных зарядов после 
второй ротации двумя путями: либо умножая Vida 2P, 
либо умножая Vo (AY? -Aa >). Второй путь приводит к 
меньшим ошибкам, поэтому определим матрицу совместного 
поворота осей 1, 2 и 2, 3: | 


1,2 2,3 (1,2 (2,3 
а рее и = 


2) 
0.75.0324 ЕО 
== |280). 7437029 90-0. 0241 
0 О ВЕР О-, Оь 0,9 


0,74 0,50 0,50 
=| —0,74 0,50 0,50 |, 
0.0 0 
а затем умножим на нео исходную сокращенную факторную 
матрицу 
| у, И-М a 
0,500 0,365 — 0,145 
0,733 —0,448 0,075 
И м см 
—| 0.747 —0.220 —0.455 || 07° 0,50 0,50 |= 
0.590 —0,404 —0,194 0 Я Не 
0,249 0,365 —0,099 


0,096 0,329 0,535 
0,604 0,254 0,360 
0,582 0,095 0,537 
0,655 0,358 — 0,438 |’ 
0,705 0,230 —0,044 | 
—0,104 0,364 — 0,224 


где У, — сокращенная факторная матрица после двух ротаций - 
(переменные — по строкам, сверху вниз, факторы — по столб- 
цам, слева направо). 

Геометрическая интерпретация факторной структуры, со- 
гласно матрице Va, представлена на рис. 7.3.7. Можно видеть, 
что требования «простой структуры» приблизительно выпол- 
няются. 

Теперь остается проверить результаты вращения. Проверка 
выполняется следующим образом. Во-первых, необходимо вы- 
числить запасы общей изменчивости по матрице У, и сравнить их 
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A 


3 $ Таблица 7.3.10 


z 2 

i h; 
4 тр P ACOR ORMA. 

вычисленные | вычисленные 
по У, по Vo 

1 0,403. 0,404 _ 0,004 
2 0,557 0,556 0,001 
3 0,635 0,683 0,002. 
4 0,589 0,586 0.003. 
5 0,552 0,548 0,004 
6 0,188 0,189 0,001 


с полученными по матрице Vo. Это сделано в табл. 7.3.40. Можно 
видеть, что расхождения незначительны, следовательно, процесс 
ротации искажений не внес. Во-вторых, необходимо по уравнению 


а 6 6 


02 0,4 0,6 


t} 


-F> 


Рис. 7.3.7. Три проекции факторной структуры после двух 
ротаций (согласно матрице Т.). 
а — для факторов Е” и Ро, 6 — для факторов Fs и Fy в — для факторов Fi 
и Fz. Точки — проекции концов векторов переменных. 


(7.1.7) вычислить ‘по матрице V, репродуцированные коэффи- 
циенты корреляции и прибавить к ним соответствующие элементы 
из третьей остаточной матрицы (табл. 7.3.9), а затем сравнить 
с исходными коэффициентами корреляции (табл. 7.3.3). При сокра- 
щенном методе проверки, как указывалось, вычисляют не все 
коэффициенты, а только выборочно — т пар, как показано 
в табл. 7.3.11. | | 

Так как при факторизации векторы некоторых переменных 
были подвергнуты обращениям, то это необходимо учесть при 


‚ суммировании остатков г;;. Здесь используется следующее Npa- 
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Таблица 7.3.11 
ее проверка иеходных коэффициентов корреляции на основе 


матрицы факторов V2 } 
Пары "ij ‚ Сумма 
nepe- „ | B третьей обращений Новый * = Исходный| Расхож- 
сажа ПА ке r a переменных FUAN rij trij Ts; nenne 
ных ной мат- ти) rij eg 
ij pune 


0,334 | —0,034 Четная-(2) |= 0,300 0,299 0,001 


1-и 2 
2 из 0,569 | 0,001 | Четная (4) |+ 0,570 0,568 | 0,002 
Зи 4| 0,495 0,005 Нечетная (3) — 0,490 | 0,487 0,003 
4и5| 0.545 | 0,002 | Четная (2) — 0,547 | `0,545 0,002 
5и 6 | 0,000 | —0,017 | Четная (2) = —0,017 |—0,016 0,001 
1и 6 


0,227 | —0,004 Нечетная (1) + 0,231 0,232 0,001 


вило: если сумма обращений 1-той и ]-той переменных четная, 
то знак остатка из третьей остаточной матрицы не изменяется; 
если сумма обращений переменных нечетная, то знак остатка 
изменяется на противоположный (см. табл. 7.3.11). 

Вычислительная процедура мультифакторного анализа закан- 
чивается проверкой. Далее необходима содержательная интер- 
претация выявленной латентной структуры, которая (как не- 
однократно указывалось) выходит за рамки математической 
статистики. * 


* Примеры интерпретации факторной структуры можно найти в ра- 
ботах: b. М. Теплов. Простейшие способы факторного анализа. В cô.: 
Типологические особенности высшей нервной деятельности человека, т. У. 
«Просвещение», М., 1967; В. Д. Небылицын. Современное состояние 
факториального анализа. «Вопросы психологии», 1960, № 4; B.3. Докто- 
ров. Сравнение рабочих характеристик различных методов факторного 
‚анализа при комплексном изучении человека. В сб.; Человек и общество, 
вып. IV, Изд. ЛГУ, Ji., 1969. 


ПРИЛОЖЕНИЕ 1 


НЕОБХОДИМЫЕ СВЕДЕНИЯ О МАТРИЦАХ И ДЕЙСТВИЯХ C НИМИ 


Матрицей называется прямоугольная (т Х п) таблица чисел (или дру- 
гих символов), размещенных в. т строках и п столбцах. Полностью матрица 
записывается так: 


`@а11 412 --. Aln 


а sa cA а 
АРС 22 2n | 
где а;; при i = 1,2,..., ти] =1,2,..., п — элемент матрицы А, лежа- 


НН на пересечении {-той строки и ]-того столбца. Сокращенная запись: 
= || ajj ||. x 
о с одинаковым количеством строк и столбцов называется квад- 
ратной; тогда говорят O порядке матрицы. Матрица n X п есть матрица 
порядка п. Элементы а;; (например, а11, а5о, . - + Gnn) в квадратной матрице 
образуют ее главную диагональ и называются диагональными; . остальные 
элементы а;; при #52 j — недиагональные. Матрица, для которой все недиаго- 
нальные элементы равны нулю, а диагональные отличны от нуля, называется 
диагональной. Диагональная матрица, у которой все диагональные элементы 
суть единицы, называется единичной. 
Транспозицией матрицы А называется матрица А’ (транспонированная 
матрица), у которой столбцы — это строки исходной матрицы А. Например: 


411 921 @31|. 411 @12 411 421 
А=| 421 azl; А" | ; А= А 
412 @25 @32 421 422 a12 422 


Можно видеть, что транспонирование квадратной матрицы достигается 
поворотом исходной матрицы на 180° вокруг главной диагонали. Аналогич- 
ный поворот прямоугольной матрицы производится вокруг оси, проводимой 
мысленно через элементы а11 И Amn- 

О двух матрицах А и В говорят, что они равны (А = В), если они имеют 
одинаковое число строк и столбцов и если все ajj = 6;;. Квадратная матрица 
называется симметричной, если она равна своей транспозиции: А = А’. 
Заметим, что в симметричной матрице элементы, равноудаленные вниз и 
вверх (по перпендикуляру) от главной диагонали, попарно равны: Qij = ай. 
Например: 


2::%-:.4 2-4 $1 
А=| 44-3 SA STA 433]: 
о 34 


412 


Матрицу можно расчленить на части; особое значение имеют векторы, 
подматрицы и скаляры. Вектором называется величина, имеющая направле- 
ние. Векторы, расположенные перпендикулярно друг другу, называются 
независимыми (ортогональными).* Заметим, что строки и столбцы прямо- 
угольной (квадратной) матрицы удовлетворяют понятию ортогональных BEK- 
торов; поэтому говорят о векторе-строке И векторе-столбуе. Заметим также, 
что вектор-строка является матрицей (1 Х п), в которой всего одна строка и 

п столбцов. Аналогично, вектор-столбец — это матрица (т X 1), в которой 
т строк, но один столбец. 

Будем называть одноименными :-тую строку и 1-тый столбец, которые 
при транспонировании заменяют друг друга. ** Тогда, удаляя одноименные 
столбцы и строки из матрицы, получаем подматрицы. В частности, из квад- 
ратной матрицы порядка N можно получать подматрицы разного порядка, 
удаляя по k одноименных строк и столбцов (k =1,2,....М— 1): 


@ %2 13 


` ` Заметим, что «минимальная» подматрица порядка 1 — это отдельный и диа- 
гональный элемент квадратной матрицы (а;;). Матрица (1 X 1), состоящая 
всего из одного элемента, называется скаляром.*** 

Подматрицу В матрицы А, полученную удалением одноименных столб- 
цов и строк, можно записать, заменяя удаленные элементы нулями; соответ- 
ственно, удаленную часть В матрицы А можно записать, заменяя нулями 
элементы подматрицы В: 


211 @12 @137 ГО _0' Од гал а 413 

а21 A22 A28 О 422 a23 а 0 0 

аз1 @32 @38 О 42432 а33- аз 0 0 
А В В 


* Любой вектор может быть нормирован, т. е. преобразован в величину; 
принимающую значения от 0 до 1, и тогда называется ортом. 

** Действительно, транспонируя воктор-столбец, получаем вектор-строку, 
и наоборот. 

*** Вообще любой элемент а;; матрицы _А можно рассматривать как 
скаляр, но получаемый другим путем (умножением вектора-строки на вектор- 
столбец, см. ниже). 


413. 


Поскольку удаленная часть В дополняет подматрицу В до целой матрицы А, 


часть В можно назвать дополнением матрицы В до матрицы А. При опреде- 
ленных условиях любую матрицу можно рассматривать как подматрицу 
В некоторой целой матрицы А более высокого порядка и дополнять одноимен- 
ными строками и столбцами, элементы которых, в частности, мегут быть 
только нулями. 

Рассмотрим сложение матриц. Здесь выделяются: сложение матрицы и 
скаляра (числа), сложение двух (и более) матриц, объединение матриц. Сум- 
мировать матрицу и число означает увеличить все элементы матрицы на это 
число: o! 


D b b — 6 5&0 
a+o=| a12 + |: АШ—ь | а12 |. 
аз }b az24+0b а21—6 а2—Ь 


Суммировать матрицы с одинаковым числом строк и столбцов — это значит 
суммировать (алгебраически) все одноименные элементы: 


ayy 611 — c11 а12- 612—512 413 +bı3— ый 
a21 621 —С21 @22--622— C22 23+ 623— 623 


лав [ 
Объединение матриц это специальный вид сложения, при котором мат- 


рицы — слагаемые относятся к одному и тому же явлению. Тогда в частном 
случае слагаемые рассматриваются как подматрица и ее дополнение: АЕ. 


= В + В, ав более общем (если имеется частичное пересечение элементов) — 
как разные подматрицы и их дополнения, получаемые из одной и той же 
неизвестной матрицы в разных испытаниях. 

Пусть, например, изучаемому явлению могут быть присущи свойства 
1,2, 3 H 4, но в одном испытании для него получена матрица A, характери- 
зующая свойства 1, 2, 3, а в другом испытании — матрица A,, характеризу- 
ющая только свойства 2, 3, 4. Тогда, рассматривая матрицы А, и А, как 
подматрицы целой матрицы А и учитывая дополнения А, и A, получаем: 


A = A, U A, = (А, + А,) + (А, + А.), например: 


eo оао а 
Его = чого обо 
А=2| 320 [1/23 10 ]=2| 3200 |2 Оз+0 
3201 [370213200 -300Е2 
а ео 
Аз Аз А: Аз Аз 


Заметим, что объединение матриц по содержанию представляет собой способ 
накопления информации, получаемой в частных исследованиях. 

Рассмотрим умножение матриц. Простейшим является умножение мат- 
`’рицы на число, при этом каждый элемент матрицы умножается на число. 
Умножение векторов и матриц в общем случае некоммутативно: АВ Æ ВА. 
Поэтому здесь различают умножение слева и справа. Кроме того, умножение 
векторов и матриц оказывается возможным лишь при следующем условии: 
число столбцов первого сомножителя равно числу строк второго. Это усло- 
вие аккумулируется формулой (т X п). (п X р) = (т Ж р), где т — число 
строк первого сомножителя и произведения; п — число столбцов первого и 
число строк второго сомножителя; р —- число столбцов второго сомножителя 
и произведения. Умножение матриц сводится к (т Х р) -кратному умноже- 
нию {той строки (i =1,2,..., т) первого сомножителя на }-тый столбец 
(J =1,2,..., р) второго сомножителя. Поэтому рассмотрим сначала умно- 
жение двух векторов. _ 
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К» 


Скалярным ЕН является результат умножения вектора 
строки на вектор-столбец, которое выцолняется по формуле: 


SEE у арб; = ар 1b1j + aizb2j + - - -+ ainbnj, 


Т=1 , 


где air и 6,; — элементы вектора-строки и вектора-столбца соответственно. 
Например: . 
—_4-— | 
3 
C=AB=[2 4—1 3]. о = [2 (—1) -3-4-(—1)-3-3-4] =20. 


4 


—- o 


Заметим, что при скалярном произведении всегда (1 X n) (n X1) =1. 
При матричном произведении каждый элемент матрицы С = АВ полу- 
чается как скалярное произведение. Например, при умножении слева: 


го _  [4-2+2.9(41.14-2.3) (4-3+42.2)4 [4 77 
| ‘| 1 q-lezrneitiaeat:a -|s 5 Ji 


о 11 [1 3 2] 1(0-2414-1) (0-4-1-3) (0-3 1-2) 183 
А В С 


но при умножении справа: 


) 


Я НИ a] 
р 1 y|? |- (1.143-2-2.0) FAFA |7 7]. 
Я Е > 
Е ОДЕН 2 


Существенный интерес для факторного анализа представляет умножение 
вектора-столбца (т X 1) на его транспозицию — вектор-строку (1 X m), 
в результате чего получается симметричная матрица порядка т: 


а11 | = | aut а11412 ++- @11@а1т — 

a? a214 A214122 ... @91а] 

. z ` [a1 a12 : Е F aim] Ti = Е . : A . . . Е = e 
Lami z — @т 1411 9@т1@а12 .-- @тт1ат_ 


Отметим, что симметричная матрица порядка т всегда получается при умно- 
жении матрицы с т строками на ее транспозицию. 

В заключение следует указать, что умножение матриц ассоциативно: 
АВС = (АВ).С = А(ВС), и справедливо обычное возведение в степень: 
Ак = А^-1.А при натуральном k => 1, причем A! =A. 


mMm 


| ПРИЛОЖЕНИЕ 2 
МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ 
| Таблица I 


Значение функции распределения F (x) плотноети f(z) 
| нормального закона 


х | Е (%) | f (x) 


X | F (x) | 71 (х) 


0,0 0,50000 0,39894 2,0 0,97725 0,05399 
1 53983 39695 1 98214 04398 

2 57926 39104 2 98610 03547 

3 61791 38139 3 98928 - 02833 
4 65542 36827 4 99180 02239 
0,5 0,69146 0,35207 2,9 0,99379 0,01753 
6 72575 33322 6 99534 01358 

7 75804 31225 7 99653 01042 

8 78814 28969 8 99744 00792 

9 81594 26699 9 99813 00595 
1,0 0,84134 0,24197 3,0 0,99865 0,00443 
1 86433 ‚24785 1 99903 00327 

2 88493 19419 - 2. 99931 00238 

3 90320 17137 - 3 99952 00172 

4 91924 14973 4 99966 00123 

a Fi, 0,93319 0,12952 3,9 0,99977 0,00087 
6 94520 11092 6 99984 00061 

7 95543 09405 7 99989 00042 

8 96407 07895 8 99993 00029 

9 97128 06562 9 99995 00020 


Таблица П 
Гамма-функция (По И. H. Бронштейну и К. А. Семендяеву, 1965) 


Значения гамма-функции для х<1{1 и для х>2 вычисляются по формулам 
Г (х)= Г (х- 1): x; Г (х)=(х— 1) Г (x— 1). Например: Г (0,7) =Г (1,7): 0,7 = 0,90864: 0,7= 
—=1,2981; Г (3,5)=2,5-Г (2,5) =2,5.1,5Г (1,5)=2,5.1,5.0,88 623 =3,32336. 


x Г (x) x Г (x) x Г (x) х Г (x) 
1,00 1,00000 1,25. 0,90640 1,50 0,88623 1,75 0,91906 
01 0,99433 26 0,90440 91 0,88659 76 0,92137 
02 0,98884 21 0,90250 02 0,88704 77 0,92376 
03 0,98355 28 0,90072 53 0,88757 78 0,92623 
04 0,97844 29 0,89904 54 0,88818 79 0,92877 
1,05 0,97350 1,30 0,89747 1,59 0,88887 1,80 | 0,93138 
06 0,96874 31 0,89600 96 0,88964 81 0,93408 
07 0,96415 32. 0,89464 57 0,89049 82 0,93685 
08 0,95973 33 0,89338 58 0,89142 83 0,93969 
09 0,95546 34 0,89222 59 0,89243 84 0,94261 
1.10 0,95135 1,35 0,89115 1,60 0,89352 1,85 0,94561 
11 0,94740 36 0,89018 61 0,89468 86 0,94869 
12 0,94359 37 0,88931 62 0,89592 87 0,95184 


Г (x) 


0,93993 


Г (х) 


x 


Soi роболжение табл. II 


4 < к- © —1-> 00 © № 


38 0,88854 63 0,89724 88 0,95507 

0,93642 39 0,88785 64 0,89864 89 0,95838 

1,15 0,93304 1,40 0,88726 1,65 0,90012 1,90 0,96177 

16 0,92980 41 0,88676 66 0,90167 91 0.96523 

17 0,92670 42 0,88636 67 0,90330 92 0,96877 

18 0,92373 43 0,88604 68 0,90500 93 0,97240 

19 0,92089 44 0,88581 69 | 0,90678 94 0,97610 

1,20 0,91817 1,45 0,88566 1,70 0,90864 ту 0,97988 

21 0,91558 46 0,88560 71 0,91057 96 0,98374 

22 | 0,91311 4T 0,88563 2 0,91258 97 0,98768 

23 0,91075 48 0,88575 73 0,91467 98 | - 0,99171 

24 0,90852 49 0,88595 74 0,91683 99 0,99581 

1,25 0,90640 1,50 0,88623 1,75 0,91906 2,00 1,00000 
Таблица ТИ 

Значения 2-преобразования Фишера для rjj | 
(по А. К. Митропольскому, 1961) 

Tij 0 1 2 3 4 5 6 ji 8 9 

0,0 | 0,00001 0,0100 | 0,0200 | 0,0300 | 0,0400 | 0.0504 | 0,0604 | 0,0704 | 0,0802 | 0,090 

1 4 0,1003 | 0,4405 | 0,1206 | 0,1308 | 0,1409 | 0,1511 | 0,1614 | 0,1717 | 0,4820 | 0,192 

2 | 0,2027 | 0,2132 | 0,2237 | 0,2342 | 0,2448 | 0,2554 | 0,2661 | 0,2769 | 0,2877 | 0,298 

3 | 0,3095 | 0,3206 | 0,3317 | 0,3428 | 0,3541 | 0,3654 | 0,3769 | 0,3884 | 0,4004 | 0,444 

4 | 0,4236 | 0,4356 | 0,4477 | 0,4599 | 0,4722 | 0,4847 | 0,4973 | 0,54104 | 0,5230 | 0,536 

5 | 0,5493 | 0,5627 | 0,5763 | 0,5901 | 0,6042 | 0,6184 | 0,6328 | 0,6475 | 0,6625 | 0,677 
6 | 0,6931 | 0,7089 | 0,7250 | 0,7444 | 0,7582 | 0,7753 | 0,7928 | 0,8107 | 0,8291 | 0,848 

7 | 0,8673 | 0,8872 | 0,9076 | 0,9287 | 0,9505 | 0,9730 | 0,9962 | 1,0203 | 1,0454 | 41,0714 

8 | 1,0986 | 1,1270 | 1,1568 | 1,1881 | 1,2212 | 1,2562 | 1,2933 | 1,3331 | 1,3758 11,421 
9 | 1,4722 | 1,5275 | 1,5890 | 1,6584 | 1,7380 | 1,8318 | 1,9459 | 2,0923 | 2,2976 | 2,646 
Таблица IV 

Значения r;; для ё-преобразования Фишера 
(по А. К. Митропольскому, 1961) 
Нуль целых опущен 

2 0 1 2 3 4 5 6 7 8 9 
0,0 | 0000 | 0100 | 0200 | 0300 | 0400 | 0500 | 0599 | 0699 | 0798 | 0898 
1 | 0997 | 1096 | 1194 | 1293 | 1391 | 1489 | 1586 | 1684 | 1781 | 1877 
2 | 1974 | 2070 | 2465 | 2260 | 2355 | 2449 | 2543 | 2636 | 2729 | 2824 
3 | 2943 | 3004 | 3095 | 3485 | 3275 | 3364 | 3452 | 3540 | 3627 | 3714. 
4 | 3800 | 3885 | 3969 | 4053 | 4136 | 4219 | 4304 | 4382 | 4462 | 4542 
‘5 | 4621 | 4699 | 4777 | 4854 | 4930 | 5005 | 5080 | 5454 | 5227 | 5299 
6 | 5370 | 5441 | 5511 | 5580 | 5649 | 5717 | 5784 | 5850 | 5915 | 5980 
7 | 6044 | 6107 | 6169 | 62341 | 6291 | 6351 | 6441 | 6469 | 6527 | 6584 
8 | 6640 | 6696 | 6751 | 6805 | 6858 | 6914 | 6963 | 7014 | 7064 | 7114 
9. |- 7163 | 7241 | 7259 | 7306] 7352 |’ 17398 | 7443 | 7487 | 7531 | 7574 


21 г. В. Суходольский 


во 00 1 © сл > wN => © <> 00 -1 © вл > 6 № -> © 


Критические значения выборочного коэффициента 
линейной корреляции г, (по В. IO. Урбаху, 1964) 


r незначим при г < г 


9871 
9894 
9914 
9929 
9942 


7739 
8110 
8426 
8692 
8917 
9104 
9261 
9394 
9498 
9587 
9661 
9722 
9771 
9812 
9846 
9874 
9897 
9915 
9931 
9943 


и значим при r>r 


9944 


9933 


9945 


П родолжение табл. IV 


-3 


7857 | 7895 
8210 | 8243 
8511 | 8538 
8764 | 8787 
8977 | 8996 
9154 | 9170 
9302 | 9316 
9425 | 9436 
9527 | 9536 
9611 | 9618 
9680 | 9686 
9738 | 9743 
9785 | 9789 
9823 | 9827 
9855 | 9858 
9881 | 9884 
9903 | 9904 
9920 | 9922 
9935 | 9936 
9946 | 9947 


9937 | 9938 
9948 | 9949 


Таблица У 
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&=0,05 «=0,01. 

n a= = 1% n oA =1% 
4 0,950 - 0,990 "726 0,388 0, ‚496 
5 0,878 0,959 27 0,381 0,487 
6 0,811 9,917 28 0,374 0,478 
7 0,754 0,874 29 0,367 0,470 
8 0,707 0,834 30 0,361 0,463 
9 0,666 0,798 35 0,332 0.435 
10 0,632 0,765 40 0,310 0,407 
11 0,602 ` 0,735 45 0,292 0,384 
12 0,576 0,708 50 0,277 0,364 
13 6553 0.684 60 0,253 0,333 
14 0,532 0,661 70 0, „294 0,308 
15 0,514 0,641 80 0,219 0,288 
16 0,497 0,623 90 0,206 0,272 
17 0,482 0,606 100 0,196 0.258 
18 0,468 0,590 125 0,175 0,230 
19 0,456 0,575 150 0,160 0.210 
20 0,444 ak s En 200 0,138 0,182 
24 0,433 ‚ 0,549 250 0,124 0,163 
22 0,423 0;537 300 0,113 0,148 
23 0,413 0,526 400 0,098 0,128 
_ 24 0,404 0,515 500 0,088 0,115 
25 0,396 0,505 1000 0.062 0,081 


Таблица УТ 


Критические значения выборочного коэффициента 
корреляции рангов (по В. Ю. Урбаху, 1964) 


о незначим при р<о и значим при о>р 


&=0 ,05 a=0,01° 


1% n 


5% 


5% 1% 


5% 1% 


Таблица УП 


Квантили %)?-раепределения для доверительной вероятности 
1 — 9“ =0,95 и 0,99 


. Нулевая гипотеза о сходстве принимается при X’KX _0 И отклоняется при 
X >X a=0:01'° y 


y 0,95 0,99 V 0,95 0,99 y ~ 0,95 0,99 
1 3,84 6,64 31 45,0 92,2 12 92,8 103 
2 5,99 9,21 32 46,2 53,9 74 95,1 105 
3 7,82 11,3 33 47,4 54,8 76 97,4 108 
4 9,49 13,3 34 48,6 56,1 78 99,6 110 
9 11,1 15,1 395 49,8 1553 80 102 112 
6 12,6 16,8 36 51,0. 58,6 82 104 115 
t 14,1 18,5 - 37 92,2 59,9 84 106 117 
8 15,5 20,1 38 53,4 61,2 86 109 119 
9 16,9 21,1 39 54,6 62,4 88 111 122 
10 18,3 23,2 40 25,8 63,7 90 113 124 
11 19,7 24,1 41 56,9 65,0 92 115 126 
12 21,0 26,2 42 58,1 66,2 94 118 129 
13 22,4 21,1 43 59,3 67,5 96 120 131 
14 23,7 29,1 44 60,5 68,7 98 122 133 
15 25,0 30,6 45 61,7 70,0 100 124 136 
16 26,3 32,0 46 62,8 71,2 110 135 147 
17 21,6 33,4 4T 64,0 72,4 120 147 159 
18 28,9 34,8 48 65,2 13,1 130 158 170 
19 30,1 36,2 49 66,3 74,9 140 169 182 
20 31,4 37,6 50 6745 76,2 150 180 193 
и 32,7 38,9 52 69,8 78,6 200 234 249 
22 33,9 40,3 54 12,2 81,1 250 288. | 305 


27* 419 


_ Продолжение табл. VII 


у 0,95 0,99 у 0,95 0,99 м 0,95 0,99 
Z9 E i RE» 41,6 56 74,5 83,5 300 341 360 
24 36,4 43,0 58 76,8 86,0 400 448 469 
25 37,6 44,3 60 79,1 88,4 500 553 576 
26 38,9 45,6 62 81,4 90,8 600 658 683 
27 40,1 47,0 64 83,7 93,2 700 763 790 
28 41,3 48,3 66 86,0 95,6 800 867 896 
29 42,6 49,6 68 88,2 98,0 900 971 1002 
30 43,8 50,9 70 90,5 100 1000 1075 1107 


Таблица VIII 


Квантили {- распределения Стьюдента для доверительной вероятности 
1—9 =0,95; 0,99 и 0,999 


Нулевая гипотеза о сходстве. принимается при t< km0 о И отклоняется при 
kd 


> 0,01 


0.99 | 0,999 


у 0,95 0,99 


у | 0,95 


1 

2 4,305 9,925 31,599 40 2,021 2,704 3,551 
3 3,182 5,841 12,924 45 2 014 2,690 3,520 
4 2,176 4,604 8,610 50 2,009 2,678 3,496 
о 2,571 4,032 6,869 55 2,004 2,668 3,476 
6 2,441 3,707 5,959 60 2,000 2,660 3,460 
1 2,365 3,450 5,408 65 1,997 2,654 3,447 
8 2,306 3,359 5,041 70 1,994 2,648 3,439 
9 2,202 3,250 4,181 75 1,992 2,643 3,426 


12,706: | 63,657 | 636,619 35 2,030 2,124. 3,591 


10 2,228 | 3,469 4,587 80 | 1990 | 2,639 3,416 
11 2,204 | 3,106 4,437 85 | 1988 | 2,635 3,412 
12 2,179 | 3,054 4,348 90 | 1,987 | 2,632 3,402 
13 2160 | 3,012 4,221 95 | 1,985 | 2,629 3,396 
14 2.145 | 2,977 4.140 100 | 1,984 | 2,626 3,390 
15 2134 | 2.947 4.073 105 | 1983 | 2,623 3,386 
16 2120 | 2,924 4.015 110 | 1982 | 2,624 3,382 
17 2110 | 2,898 3,965 120 | 1,980 | 2,647 3,374 
18 2101 | 2,878 3,922 130 | 1978 | 2,644 3,366 
19 2093 | 2,861 3,883 140 | 1,5977 | 2,644 3,361 
20 2086 | 2,845 3,850 150 | 15976 | 2,609 3,357 
24 2.080 | 2,831 3,819 200 | 1972 | 2,604 3,340 
22 2,074 | 2,819 3,792 300 | 1968 | 2,592 | 3323 
23 2069 | 2,807 3,768 400 | 1,5966 | 2,588 3,345 
24 2,064 | 2,197 3,745 500 | 1,965 | 2,586 3,310 
25 2.060 | 2,787 3725 | 600 | 1,964 | 2,584 3,306 
26 2056 | 2,779 3,707 700 | 19634 | 2,5829 | 3,304 
27 2052 | 271 3,690 800 | 19629 | 2,5820 | 3,302 
28 2,048 | 2,763 3.674 900 | 19626 | 2,5843 | 3,301 
29 | 2,045 | “2.156 3.659 | 1000 | 1,9623 | 2,5808 | 3,300 
30 2042 | 2150 3646 | со 1,9600 | 2,5758 | 3,291 


Таблица IXa 


0,95 


1—@ 


u 


-распределения для доверительной вероятности 


Квантили F 


(по А. К. Митропольскому, 1961) 


‚ у, —число степеней свободы числителя; у, —знаменателя. 
05 , 


a=0, 


Нулевая гипотеза о сходстве принимается при F < F 
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(по А. K. Митропольскому, 1961) 


Нулевая гипотеза о сходстве отклоняется при F >01; \:—для числителя, у, —для ‘знаменателя. 
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Квантили Р-раепределения для доверительной вероятности 1 — Q 
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П родолжение табл. 1Х6 
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Таблица Х 


Квантили С-распределения Кохрана для доверительных вероятностей 
1 —&=0,95 (напечатаны обычным шрифтом) и 1 — “=0,99 
(напечатаны жирным шрифтом) (по В. Ю. Урбаху, 1964) 


Ноль целых и запятая опущены. Нулевая гипотеза о сходстве принимается при 


а 35, 0,05 и отклоняется при “>69, т— число сравниваемых дисперсий; у—чис- 
ло степеней свободы. 
т 3 4 5 6 T 8 9 10 
y 
1 967 906 841 781 721 680 638 602 
993 968 928 883 838 794 754 718 
2 871 768 684 616 561 516 478 445 
942 864 788 722 664 615 573 534 
3 798 684 598 532 480 438 403 373 
883 781 696 626 568 521 481 447 
4 746 629 544 480 431 391 358 331 
834 724 633 564 508 463 425 393 
9 707 590 506 445 397 360 329 303 
793 676 588 520 466 423 387 357 
6 677 560 418 418 373 336 307 282 
761 641 553 487 435 393 359 331 
7 653 536 456 398 354 318 290 267 
734 613 526 461 410 370 338 311 
8 633 518 439 382 338 304 277 254 
741 590 504 440 391 352 321 294 
9 617 502 424 368 326 293 266 244 
691 570 485 423 375 337 307 281 
10 602 488 412 357 315 283 257 г. = 
674 554 470 408 362 325 295 270 
12 580 466 392 339 298 267 244 224 
647 527 445 384 340 305 277 254 
14 560 450 377 325 285 256 м 213 
625 503 425 368 322 290 263 240 
16 547 437 364 313 277 246 PFA, 203 
606 488 409 353 310 278 251 230 
18 536 425 358 305 267 239 217 199 
590 474 397 340 298 269 243 221 
20 526 416 I) 298 259 230 210 191 
577 461 845 330 289 260 235 215 
25 504 397 329 282 245 219 198 180 
550 438 363 312 270 243 219 200 
30 490 383 345 270 233 209 190 173 
533 420 349 299 259 230 209 190 
39 479 372 306 262 2217 201 183 216 
518 408 337 288 250 222 200 182 
40 469 364 298 259 220 195 177 162 
505 397 327 280 242 215 192 177 
45 460 357 291 250 215 190 173 157 
496 387 319 272 235 209 288 172 
50 459 350 288 246 210 186 170 422 
488 380 312 266 230 204 184 167 
60 444 341 219 239 204 179 161 148 
474 368 300 256 220 198 177 160 
80 429 329 268 221 195 170 154 140 
455 350 285 243 210 186 164 150 


Продолжение табл. Х 


т 3 4 AE 6 7 8 9 A0 

V 

100 447 319 261 220 189 165 159 136 
441 338 277 235 202 180 160 143 

150 401 305 250 211 180 160 145 130 
421 322 263 220 194 170 150 137 

200 390 299 246 210 180 158 142 130. 
410 310 255 215 190 165 148 135 

- Таблица XI- 


Допустимые уровни расслоения корреляционной матрицы 
при доверительной вероятности 0,99 


п—число наблюдений; т (0) значение нулевой «секущей» плоскости —минимальная 
значимая абсолютная величина коэффициента корреляции; | Ат | —допустимый «шаг» pac- 


слоения; $5 —допустимое число уровней расслоения; т (1), г (2), . 
значения секущих плоскостей. 


n r(0) 


0,407 
0,364 
0,333 
0,288 
0,258 
0,236 


0,182 
0,148 
0,128 
0,115 
0,106 
0,098 
0,091 


0,210. 


LAr] 


0,598 
0,500 
0,462 
0,401 
0,363 
0,328 
0,296 
0,254 
0,207 
0,182 
0,162 
0,150 
0,139 
0,129 
0,122 
0,116 
0,100 


$ 


о —1 1 -1 <> Сл © НН 02 №2 № № => = => + 


т (1) 


0,965 
0,864 
0,795 
0,689 
0,621 
0,564 
0,505 
0,436 
0,355 
0,340 


0,277 


0,256 


0,237 | 


0,220 
0,208 
0,197 


0,470 | 


т (2) 


ры же eee 


т (3) 


т (4) 


0 
0,856 


Не) 
~] 
D 


0,661 


t (51 r6) 


Е 


PEE Tie 


0,856 
0,793 
0,736. 
0,696 


0,570 


0,925 


... Т(9)—абсолютные 


т (7) |т (8) | г(9) 


А 


0,994 
0,940 


Re E аа иж 
0,770 |0,87010,970 


а | 
И На ВОЙН 


ЛИТЕРАТУРА 


Абергауз Г. Г., А. П. Тронь Ю.Н. нео И.А. Ко- 

ров Pe на. Справочник. по вероятностным расчетам. ВИ МО СССР, M., 1970. 
дерсон Т. Введение в многомерный статистический анализ. 

MOMI M., 1963. 

А ртем ьев а Е. Ю. Сборник задач по теории вероятностей и мате- 
матической статистике для психологов. Изд. МТУ, M., 1969. 

Башаринов A.E., Б.С. Флейшман. Методы статистического 
последовательного анализа и их приложения. «Советское радио», М., 1962. 

Беккенбах 9. (ред.). Прикладная комбинаторная математика. 
«Мир», M., 1968. 

Белинский B.A, И. Л. Калихман, Л. Е. Майстров, 
А. М. Митькин. Высшая математика с основами математической стати- 
стики. «Высшая школа», М., 1965. 

Бейли H. Статистические методы в биологии. ИЛ, M., 1962. 

та ? нстайн А. Справочник статистических решений. «Статистика», 
М., 1968. 

Большев J.H., H. В. Смирнов. Таблицы математической 
статистики. ВЦ АН СССР, M., 1968. 


Боревич 3. И. Определители и матрицы. «Наука», ГРФ-МЛ,. 


М... 1979; 

Борель 3. Вероятность и достоверность. «Наука», M., 1964. 

B ородачев Н. А. Основные вопросы теории точности upprop 
ства.’ Изд. AH CCCP. M. — JI., 1950. 

a s С унли K.A. Статистические исследования в производстве. ИЛ, 
a Aa 

Бусленко Н. П. Метод статистического моделирования. (Crore 
стика», M., 1970. 

Вальд А. Последовательный анализ. Физматгиз, М., 1960. 
Е ан дер Варден Б.Л. Математическая статистика. ИЛ, 
Венецкий И. Г. Вариационные ряды и их характеристики. «Статн- 

стика», M., 1970. 

Венецкий M.T., Г.С. Кильдишев. Основы теории вероят- 
ностей и математической статистики. «Статистика», M., 1968 

Вентцель Е. С. Теория ` вероятностей. «Наука», M., 1964. 

Вентцель E.C., Л. А. Овчаров. Теория вероятностей. «Нау- 
ка», ГРФ-МЛ, М., 1969. 
sa paa ьф В. Г. Статистическая обработка опытных данных. «Колос», 

Вобтинокиы ЕЯ B-A Прянишников. Методы и сис- 
ms для статистического анализа электроэнцефалограмм. «Наука», M., 


426 


x 


= ерчук Я. П. Графические методы в статистике. «Статистика», M., 
1968. 

Гмурман В.Е. Руководство к решению задач по теории вероят- 
ностей и математической статистике. «Высшая школа», М., 1970. 

Гнеденко B.B. Курс теории вероятностей. ГИФ-МЛ, M., 1961. 

Гнеденко B.B., Ю.К. Беляев, А. Д. Соловьев. Мате- 
_матические методы в теории надежности. «Наука», ГРФ-МЛ, M., 1965. 

Гумбель 9. Статистика экстремальных значений. «Мир», M., 1965. 

Дайменд С. Мир вероятностей. «Статистика», M., 1970. 

Джини K. Средние величины. «Статистика», M., 1970. 

Долгушевский Ф. Г., В. С. Козлов, п. И. Полушин, 
Я. М. Эрлих. Общая теория статистики. «Статистика», M., 1967. _ 

Дружинин H.K. Выборочный метод и его применение `В экономи- 
ческих исследованиях. «Статистика», M., ; 

Езекиел М., К.А. Фокс. Методы анализа корреляций и регрес- 
сий. «Статистика», M., 1966. ; 

Емельянов Г. В., В. П.Скитович. Задачник по теории Be- 
роятностей и математической статистике. Изд. ЛГУ, Л., 1967. 

Ефимов Н. В., Э.Р. Розендорн. Линейная алгебра и много- 
мерная геометрия. «Наука», ГРФ-МЛ, M., 1970. 

Ae дельА.Н. Элементарные оценки ошибок измерения. «Наука», 
=, l 

Каминский Л. С. Статистическая обработка лабораторных и 
клинических данных. «Медицина», Л., 1964. 

Карасев А. И. Теория вероятностей и математическая статистика. 
«Статистика», M., 1970. 

Кемниц Ю. В. Теория ошибок измерений. «Недра», M., 1967. 

Кендалл М. Дж., А. Стьюарт. Теория распределений. «Нау- 
ка», ГРФ-МЛ, М., 1966. 

Кокс H., H. Льюис. Статистический анализ последовательностей 
событий. «Мир», М., 1969. 

Колесников А. Ф. Основы математической обработки результатов 
измерений. Изд. Томск. ун-та, Томск, 1963. 

Кордонский X. E. Приложения теории вероятностей в инженер- 
ном деле. ГИФ-МЛ, М. — JI., 1963. 

К узичев А. С. Диаграммы Венна. «Наука», М., 1968. 

К ульбак С. Теория информации и статистики. «Наука», ГРФ-МЛ, 
М., 1967. 
ogo! евин Б.Р. (ред.) Справочник по надежности, T. I. «Мир», M., 

Леман 3. Проверка статистических гипотез. «Hayka», M., 1964. 

Лукомский Я. И. Теория корреляции и ее применение к анализу 
производства. Госстатиздат, M., 1964. 

Майстров Л.Е. Теория вероятностей (исторический очерк). 
«Наука», М., 1967. \ 

Маринеску И., Ч. Мойняту, P. Никулеску, Н. Pam- 
ку, В. Урсяну. Основы математической статистики и ее применение. 
«Статистика», М., 1970. 

Маслов П. П. Статистика (учебное пособие). «Мысль», М., 1964. 

Митропольский А. К. Техника статистических вычислений. 
Физматгиз, М., 1961. 
i M or теллер Ф., P. Pypke, Дж. Томас. Вероятность. «Мир», 

Ты 

Мюллер Д., К. Шусслер. Статистические методы в социоло- 
гии (части I, И, Ш. Информационный бюллетень Советской социологиче- 
ской ассоциации, №№ 10, 11, 12, М., 1968. | 

Нейман Ю. Вводный курс теории вероятностей ‘и математической 
статистики. «Наука», ГРФ-МЛ, M., 1968. 

Осипов Г.В. (ред.) Математические методы в современной бур- 
жуазной социологии. «Прогресс», М., 1966. 


427 


Осипов Г. B. (ред.). МароиЕ и техника статистической обработки 
первичной социологической информации. «Наука», М., 1968. 

О уэн Д. B. Сборник статистических таблиц. ВЦ АН СССР, M., 1966. 

Павловский 3. Введение в математическую статистику. «Стати- 
стика», M., 1967. 

Пагурова В.И. Критерий сравнения средних значений по двум 
нормальным выборкам. ВЦ АН СССР, М., 1968. 

Пирятин В.Д. Обработка результатов экспериментальных измере- 
м способу наименьших квадратов. Изд. Харьковск. ун-та, Харьков, 

Плохинский Н.А. Биометрия. Изд. МГУ, М., 1970. 

Прохоров Ю. В., Ю.А. Розанов. Теория вероятностей. «Нау- 
ка», ГРФ-МЛ, M., 1967. 

Пугачев В. С. Теория случайных функций. ГИФ-МЛ, M., 1962. 
м. а ачев В. С. Введение в теорию вероятностей. «Наука», ГРФ-МЛ, 
= ПустыльникЕ. И. Статистические методы анализа и обработки 
наблюдений. «Наука», ГРФ-МЛ, М., 1968. 

Рао С.Р. Линейные статистические методы и их применение. «Наука», 
ГРФ-МЛ, М., 1968. 

Рейхман У. м Применение статистики. «Статистика», М., 1969. 
7 AS- Е. анов Ю. А. Лекции по теории вероятностей. «Наука», ГРФ-МЛ Е 

Розин Б.Б. (ред.) Статистические методы в экономическом авализе 
производства. «Наука», СО, Новосибирск, 1968. 
| Рокицкий П.Ф. Биологическая статистика. Минск, 1967. 

’ Румшиский Л.3. Элементы теории вероятностей. «Наука», 
ГРФ-МЛ. М., 1970. 

Свешник ов А. А. Прикладные методы теории случайных функций. 
Судпромгиз, JES- 4964. 

Свешник ов А. А. Сборник задач по теории вероятностей, матема- 
ЕЕ статистике и теории случайных функций. «Наука», ГРФ-МЛ, 

э. 

Семендяев К. А. Эмпирические формулы. ГТТИ, М. — Jl., 1933. 

Смирнов Н. В. Теория вероятностей и математическая статистика. 
Избранные труды. «Наука», M., 1970. - 

Смирнов H.B., И. В. Дунин-Барковский. Курс теории 
вероятностей и математической статистики для технических приложений. 
«Наука», ГРФ-МЛ, M., 1965. 

Смирнов Н. В., Д. А. Белугин. Теория вероятностей и мате- 
матическая статистика B приложении к геодезии. «Недра», M., 1969. 

F Стройк д. Я. Краткий очерк истории математики. «Наука», ГРФ-МЛ, 
‚4969. 

Уилкс С. Математическая статистика. «Наука», ГРФ-МЛ, M., 1967. 

У рбах В. Ю. Биометрические методы. «Наука», M., 1964. 

Феллер В. Введение в теорию вероятностей и ее приложения, т.м 
2. «Мир», M., 1967. 

Фильчаков П. Ф. Численные и графические методы прикладной 
математики. «Наукова думка», Киев, 1970. 

Финни Д. Введение в теорию планирования экспериментов. «Наука», 
ГРФ-МЛ, М., 1970. 

Фише р Р.А. Статистические методы для исследователей. Госстатиз- 
дат, М., 1958. 

Хан Г., С. Шапиро. Статистические модели в инженерных зада- 
чах. «Мир», 'М., 1969. 

Х удсон Д.. Статистика для физиков. «Мир», M., 1967. 

Чернов Г., Л. Мозес. Элементарная теория статистических 
решений. «Советское радио», М., 1962. 

Четвериков Н. С. (ред.) Применение методов корреляции в эко- 
номических исследованиях. «Наука», М., 1969. 


428 


Шеффе Г. Дисперсионный анализ. ГИФ-МЛ, M., 1963. 

Шторм P. Теория вероятностей. Математическая статистика. Стати- 
НЕХ контроль качества. «Мир», М., 1970. 

убкин В.Н. (составит.) Количественные методы в социологии. 

а М., 1966. 

Щ иголев Б. М. Математическая обработка. наблюдений. «Наука», 
ГРФ-МЛ, M., 1969. | 

Юл д K. yp M. Дж. Кендэл. Теория статистики. Госстатиздат, 
М., 1960. 
Яноши Л. Теория и практика обработки результатов измерений. 
«Мир», M., 1965. 

HeT p емский Б. С. Некоторые вопросы математической стати- 
стики. Госстатиздат, М., 19 
С1айзз C Е Бпег H. Grundlagen der Statistik für Psychologen, 
Pädagogen und Soziologen. Volk und Wissen Volkseigener Verlag. Berlin, 1967. 

Fabian V. Statistische Methoden. VEB Deutscher Verlag der Wissen- 
schaften. ВегПи, 1968. 

Ferguson G.A. Statistical Analysis in Psychology and Education. 
Seci- Ed.: N- У., 1966. 

Fisz M. Wahrscheinlichkeitsrechnung und mathematische Statistik. 
VEB Deutscher Verlag der Wissenschaften. Berlin, 1962. 
a Guilford J. P. Fundamental Statistics in Psychology and Education. 

p #956. 

Jahn W., H. Vahle. Die Faktoranalyse: Berlin, 1970. 

Гежтз Don. Quantitative Methods in Psychology. New Уогк—Тогоп- 
to—London, 1960. 

Harman H. Modern Factor Analysis. Univ. Chicago Press, 1960. 

Horst P. Factor Analysis of Data Matrices. N. Y, 1965. 

Rasch D. Elementare Einführung in die mathematische Statistik. VEB 
Deutscher Verlag der Wissenschaften. Berlin, 1968. 

Zschommler H. G. (gesamtred.). Biometrisches Wörterbuch. Bd. 1 
und 2. VEB, Berlin, 1969. 


Геннадий Владимирович Суходольский 


Основы математической статистики 
для психологов 


Редактор H. H. Васильева 
Техн. редактор Е. Г. Учаева 
Корректоры Р. Л. Савина, С. К. Школьникова 


М-09897. Сдано в набор 14/III 1972 г. 
Подписано к печати 2/УтТ 1972 г. 
Формат бумаги 60 X 90!/16. Бумага тип. № 3. 
Уч.-изд. I. 26,71. Печ. л. 27. Тираж 7405 экз. 5 
Заказ 1575. Цена 1p. 03 к. 


Издательство ЛГУ имени А. А. Жданова 
1994164. Ленинград, Университетская наб., 7/9. 


Ленинградская типография № 6 
Главполиграфпрома Комитета по печати 
при Совете Министров СССР. 
Московский np., 91. 


В 1972 г. ИЗДАТЕЛЬСТВО ЛГУ ПРЕДПОЛАГАЕТ ВЫПУСТИТЬ 
СЛЕДУЮЩИЕ КНИГИ: 


История преподавания и развития статистики 
в Петербургском — Ленинградском университете _ 
(1819—1971). 9л., Цена 65 к. — Авт.: Бата- 
лина T. С.,`Сиповская И. В., Суслов И. H., 
Юзбашева E. М. | 


В монографии на основе исследования тру- 
дов. профессоров Петербургского университета 
К. Ф. Германа, K. И. Арсеньева, IO. 9. Янсона, 
А. А. Кауфмана и других опровергаются бытовав- 
шие до недавнего времени представления O полном 
отсутствии в дореволюционной России оригинальной 
разработки статистической науки. Излагается история 
развития статистической теории в университете в 
советский период. История преподавания и развития 
статистики дается на общем историческом фоне 
и в связи со структурными преобразованиями уни- 
верситета, происшедшими в течение свыше 150 лет. 

‚ В значительной части монографии написана на oc- 
нове архивных источников. 

Работа рассчитана на экономистов-статистиков, 
историков науки и образования, а также всех инте- 
ресующихся историей Ленинградского университета. 


Вопросы инженерной психологии в автоматизи- 
рованных системах управления. Сборник статей. 


Под ред. С. Н. Сафаряна. 10,5 л. Цена 76 к. 


В еборник включены статьи по проблеме опти- 
мального кодирования информации на средствах 
отображения. В ряде статей предлагаются способы 
и устройства набора и ввода информации, а также 
рассматривается ‘деятельность человека-оператора, 
работающего в режиме слежения. 

Издание рассчитано на широкий круг специ- 
алистов — инженеров, психологов, физиологов. 


Экспериментальная и прикладная психология. 
Вып. 5. Сборник статей. Под ред. действ. члена 
АПН СССР Б. Г. Ананьева. 10 л. Цена 72 к. 


В сборник включены статьи, посвященные акту- 
альным проблемам общей, возрастной, дифференци- 
альной и сравнительной психологии. В нем изла- 
гаются материалы теоретических исследований по 


‚ различным проблемам (структуры и регулирующей 


функции перцептивных образов, информационного 
анализа психофизической проблемы, структуры MH- 
дивидуально-типических особенностей человека) и 
анализируются эксперимента льные данные исследо- 
ваний психических процессов разных уровней 
(перцептивных, мнемических, логических) в связи 
с возрастными, индивидуально-типическими и APY: 
гими особенностями. 

Сборник рассчитан на психологов, физиологов 
и студентов психологических отделений и факульте- 
тов университетов. 


W RORO о HHNIVOYOXAS 01 


Mo 


 AOOVOXHOU У HARLIHLVII HOKBRHLVID 


